Essential Maintenance: All Authorea-powered sites will be offline 4pm-6pm EDT Tuesday 28 May for essential maintenance.
We apologise for any inconvenience.

Andrew Krizhanovsky edited section_begin_definition_textit_w__.tex  about 8 years ago

Commit id: e4aac33e92af6a18b43abbdcb053e53e3d442f6d

deletions | additions      

       

\textit{Степень центральности синонима $w$ в синсете $s$} (degree centrality of synset)~--- /проще описать процедуру вычисления, чем дать определение.../  \end{definition}  Определим \textbf{степень центральности синонима} $w$ в синсете $s$ через процедуру вычисления этой степени:  \begin{enumerate}  \item Input data: $L$~--- list of synonyms (synset)  \item Split L to two subsets: $l_1$ and $l_2$. Известно, что оба этих списка являются синсетами (synset) для одного и того же слова $w$. (Можно рассмотреть аналогичные списки антонимов, гиперонимов...)  \item Обойти все слова в словаре. Для каждого слова $w$:  \item Вычислить расстояние между двумя подмножествами слов с помощью функции n_similarity так: $sim_0 = model.n\_similarity (l_1, l_2)$  \item То же, но заданное слово $w$ добавляется к первому подмножеству: $sim_1 = model.n\_similarity (l_1 + w, l_2)$  \item Ко второму: $sim_2 = model.n_similarity (l_1, l_2 + w)$  \item $if( sim_1 < sim_0 AND sim_2 < sim_0 ) then w \rightarrow L$ // Если добавление слова $w$ сближает подмножества, то это слово является синонимом (добавляем это слово в синсет $L$).  \end{enumerate}  Пояснения и примечания:  \begin{itemize}  \item $s \setminus w$~--- это синсет $s$ без синонима $w$