Andrew Krizhanovsky edited section_begin_definition_textit_w__.tex  about 8 years ago

Commit id: 2b5e3953fdb68889e8119a8feccb121ca3ab94fa

deletions | additions      

       

Пусть $sim_i$ -- расстояние между элементами разбиения $p_i$, $sim_i(v,1), sim_i(v, 2)$ -- расстояния между одним из элементов разбиения и множеством, являющимся объединением другого элемента и слова $v$.  temp: Для любых дизъюнктных разбиений $S\setminus \{v_l\}=\{v_{i_s}\}\sqcup \{v_{j_p}\},$   $ s=1,...,q,$ $ p=1,...,r,$ $q+r=|S|-1, \ i_s\neq j_p $.  Определим \textbf{степень центральности синонима} $w$ в синсете $S$ через процедуру вычисления этой степени:  \begin{enumerate}  \item $S \setminus w$ // вычитаем из синсета $S$ слово $w$  \item (Рассматриваем Рассматриваем  все возможные разбиения) Для любых дизъюнктных разбиений $S\setminus \{v_l\}=\{v_{i_s}\}\sqcup \{v_{j_p}\},$   $ s=1,...,q,$ $ p=1,...,r,$ $q+r=|S|-1, \ i_s\neq j_p $.  \item Split L to two subsets: разбиения $S \setminus w$ на два непустых множества  $l_1$and $l_2$. Известно, что оба этих списка являются синсетами (synset) для одного  и того же слова $w$. $l_2$,   т.е. $S \setminus w = l_1 \sqcup l_2$  \item Обойти все слова в словаре. Для каждого слова $w$:  \item Вычислить расстояние между двумя подмножествами слов с помощью функции n_similarity так: $sim_0 = model.n\_similarity (l_1, l_2)$  \item То же, но заданное слово $w$ добавляется к первому подмножеству: $sim_1 = model.n\_similarity (l_1 + w, l_2)$