Andrew Krizhanovsky Deleted File  about 8 years ago

Commit id: 62cb269efa263ac7837940cfda1e6199cbc096fd

deletions | additions      

         

\section{Средний разброс в синсете}  Пусть синсет $s$ состоит из слов $w_1, w_2, \ldots, w_n$, которым соответствуют вектора $v_1, v_2, \ldots, v_n$.  Процедура вычисления \textit{среднего разброса} синсета $\overline{sim}$ такова:  \begin{enumerate}  \item $\bar{v} = {\sum_{i=1}^{n} v_{i} \over n}$ // средний вектор синсета   \item $sim (\bar{v}, v_i) = { \bar{v} \cdot v_i \over \|\bar{v}\| \|v_i\| }$ // отклонение для каждого вектора от среднего, \textit{англ.} "cosine similarity"  \item $\overline{ sim } = {\sum_{i=1}^{n} sim (\bar{v}, v_i) \over n}$ // где $\overline{ sim } \in [0; 1]$  \end{enumerate}  Лабораторный практикум: найти 100 синсетов Викисловаря с максимальным значением среднего разброса и 100~--- с минимальным.