Andrew Krizhanovsky edited section_begin_definition_textit_w__.tex  about 8 years ago

Commit id: ca5ac70b1097d33cde9cc50729decc1d60d59763

deletions | additions      

       

temp: Для любых дизъюнктных разбиений $S\setminus \{v_l\}=\{v_{i_s}\}\sqcup \{v_{j_p}\},$   $ s=1,...,q,$ $ p=1,...,r,$ $q+r=|S|-1, \ i_s\neq j_p $.  Определим \textbf{степень центральности синонима} $w$ в синсете $S$ (centrality)  через процедуру вычисления этой степени: \begin{enumerate}  \item $S \setminus w$ // вычитаем из синсета $S$ слово $w$  \item Рассматриваем все возможные разбиения $S \setminus w$ на два непустых множества. Например, одним из разбиений является пара подмножеств $l_1$ и $l_2$, т.е. $S \setminus w = l_1 \sqcup l_2$.  \item Обойти все слова в словаре. $centrality = 0$  \item  Для каждого слова $w$: всех таких пар $l_1$ и $l_2$:  \begin{enumerate}  \item Вычислить расстояние между двумя подмножествами слов с помощью функции n_similarity так: $sim_0 = model.n\_similarity (l_1, l_2)$ \item То же, но заданное слово $w$ добавляется к первому подмножеству: $sim_1 = model.n\_similarity (l_1 + \cup  w, l_2)$ \item Ко второму: $sim_2 = model.n_similarity (l_1, l_2 + \cup  w)$ \item $\Delta centrality_ = (sim_1 - sim_0) + (sim_2 - sim_0)$  \item  $if( sim_1 < sim_0 AND sim_2 < sim_0 ) then w \rightarrow L$ // Если добавление слова $w$ сближает подмножества, то это слово является синонимом (добавляем это слово в синсет $L$). \end{enumerate}  \item   \item   \item   \item  \end{enumerate}