Andrew Krizhanovsky edited section_begin_definition_textit_w__.tex  about 8 years ago

Commit id: 81453e2299300f40e151d23659e84966ed65da07

deletions | additions      

       

\section{Ранг и степень центральности в синсете}  \begin{definition}  \textit{Ранг синонима $w$ в синсете $s$} (rank of synonym in synset)~--- это половина разницы числа различных разбиений синсета $s/w$ $S\setminus w$  на два непустых множества $s_1$ и $s_2$, сближаемых добавлением синонима $w$ к $s_1$ или $s_2$, и числа аналогичных различных разбиений $s_1$ и $s_2$, расстояние между которыми увеличивается при добавлении к ним синонима $w$. \end{definition}  \begin{definition}  \textit{Степень центральности синонима $w$ в синсете $s$} $S$}  (degree centrality of synset)~---/проще описать процедуру вычисления, чем дать определение.../  \end{definition}  Пусть $sim_i$ -- расстояние между элементами разбиения $p_i$, $sim_i(v,1), sim_i(v, 2)$ -- расстояния между одним из элементов разбиения и множеством, являющимся объединением другого элемента и слова $v$. Определим \textbf{степень центральности синонима} $w$ в синсете $s$ через процедуру вычисления этой степени:  \begin{enumerate}  \item Вычитаем $S \setminus w$ // вычитаем  из синсета $s$ $S$  слово $w$. $w$  \item (Рассматриваем все возможные разбиения) Для любых дизъюнктных разбиений $S\setminus \{v_l\}=\{v_{i_s}\}\sqcup \{v_{j_p}\},$   $ s=1,...,q,$ $ p=1,...,r,$ $q+r=|S|-1, \ i_s\neq j_p $.  \item Split L to two subsets: $l_1$ and $l_2$. Известно, что оба этих списка являются синсетами (synset) для одного и того же слова $w$.   \item Обойти все слова в словаре. Для каждого слова $w$:  \item Вычислить расстояние между двумя подмножествами слов с помощью функции n_similarity так: $sim_0 = model.n\_similarity (l_1, l_2)$