Authorea

Andrew Krizhanovsky edited section_begin_definition_textit_w__.tex about 8 years ago

Commit id: a964ec7a7a7dd899f81ee6c176d11b343ca3e40e

deletions | additions

\textit{Степень центральности синонима $w$ в синсете $s$} (degree centrality of synset)~--- /проще описать процедуру вычисления, чем дать определение.../ \end{definition} Пусть $sim_i$ -- расстояние между элементами разбиения $p_i$, $sim_i(v,1), sim_i(v, 2)$ -- расстояния между одним из элементов разбиения и множеством, являющимся объединением другого элемента и слова $v$. Определим \textbf{степень центральности синонима} $w$ в синсете $s$ через процедуру вычисления этой степени: \begin{enumerate} \item Input data: $L$~--- list of synonyms (synset) Вычитаем из синсета $s$ слово $w$. \item (Рассматриваем все возможные разбиения) \item Split L to two subsets: $l_1$ and $l_2$. Известно, что оба этих списка являются синсетами (synset) для одного и того же слова $w$.(Можно рассмотреть аналогичные списки антонимов, гиперонимов...) \item Обойти все слова в словаре. Для каждого слова $w$: \item Вычислить расстояние между двумя подмножествами слов с помощью функции n_similarity так: $sim_0 = model.n\_similarity (l_1, l_2)$ \item То же, но заданное слово $w$ добавляется к первому подмножеству: $sim_1 = model.n\_similarity (l_1 + w, l_2)$