this is for holding javascript data
Andrew Krizhanovsky edited section_begin_definition_textit_w__.tex
about 8 years ago
Commit id: 2b5e3953fdb68889e8119a8feccb121ca3ab94fa
deletions | additions
diff --git a/section_begin_definition_textit_w__.tex b/section_begin_definition_textit_w__.tex
index 70c0a23..53f9ea1 100644
--- a/section_begin_definition_textit_w__.tex
+++ b/section_begin_definition_textit_w__.tex
...
Пусть $sim_i$ -- расстояние между элементами разбиения $p_i$, $sim_i(v,1), sim_i(v, 2)$ -- расстояния между одним из элементов разбиения и множеством, являющимся объединением другого элемента и слова $v$.
temp: Для любых дизъюнктных разбиений $S\setminus \{v_l\}=\{v_{i_s}\}\sqcup \{v_{j_p}\},$
$ s=1,...,q,$ $ p=1,...,r,$ $q+r=|S|-1, \ i_s\neq j_p $.
Определим \textbf{степень центральности синонима} $w$ в синсете $S$ через процедуру вычисления этой степени:
\begin{enumerate}
\item $S \setminus w$ // вычитаем из синсета $S$ слово $w$
\item
(Рассматриваем Рассматриваем все возможные
разбиения) Для любых дизъюнктных разбиений $S\setminus \{v_l\}=\{v_{i_s}\}\sqcup \{v_{j_p}\},$
$ s=1,...,q,$ $ p=1,...,r,$ $q+r=|S|-1, \ i_s\neq j_p $.
\item Split L to two subsets: разбиения $S \setminus w$ на два непустых множества $l_1$
and $l_2$. Известно, что оба этих списка являются синсетами (synset) для одного и
того же слова $w$. $l_2$,
т.е. $S \setminus w = l_1 \sqcup l_2$
\item Обойти все слова в словаре. Для каждого слова $w$:
\item Вычислить расстояние между двумя подмножествами слов с помощью функции n_similarity так: $sim_0 = model.n\_similarity (l_1, l_2)$
\item То же, но заданное слово $w$ добавляется к первому подмножеству: $sim_1 = model.n\_similarity (l_1 + w, l_2)$