Andrew Krizhanovsky edited section_Methods_of_word_vector__.tex  about 8 years ago

Commit id: 527d77b241b1367c7c4e9e04170be3897ec33201

deletions | additions      

       

Введем обозначения для нормированных сумм векторов: $M((a_{i}),n)=\frac{\sum_{i=1}^n a_{i}}{||\sum_{i=1}^n a_{i}||}$, $M((a_{i}, v), n+1)=\frac{\sum_{i=1}^n a_{i}+v}{||\sum_{i=1}^n a_{i}+v||}$  Рассмотрим синсет $S=\{v_k, k=1,...,|S|$. k=1,...,|S|\}$.  \begin{definition}  Внутренностью $Int S$ синсета $S$ называется множество всех векторов $v_l \in S$, удовлетворяющих условию   $$  $Int S$ Int S  = \{v_l \in S: (M((v_{i_s}),q)- M((V_{i_s}, v_l), n+1), M((v_{j_p}), r))<0\} $$  для любых дизъюнктных разбиений $S\setminus \{v_l\}=\{v_{i_s}\}\sqcup \{v_{j_p}\},$   $ s=1,...,q,$ $ p=1,...,r,$ $q+r=|S|-1, \ i_s\neq j_p $.  \end{definition}. \end{definition}  Смысл определения состоит в том, что добавление вектора $v_l \in S$ в любое из двух подмножеств   множества $S\setminus \{v_l\}$, образующих его дизъюнктное разбиение, уменьшает расстояние между  этими подмножествами.