this is for holding javascript data
Andrew Krizhanovsky убрал степень центральности
about 8 years ago
Commit id: a2161c3076025d3369610c65ae726d3dc0d38bd4
deletions | additions
diff --git a/section_begin_definition_textit_w__.tex b/section_begin_definition_textit_w__.tex
index 0bd57ea..cbff605 100644
--- a/section_begin_definition_textit_w__.tex
+++ b/section_begin_definition_textit_w__.tex
...
%\section{Ранг и степень центральности в синсете}
\begin{definition}
\textit{Ранг синонима $w$ в синсете $s$} (неформально)~--- это половина разницы числа различных разбиений синсета $S\setminus w$ на два непустых множества $s_1$ и $s_2$, сближаемых добавлением синонима $w$ к $s_1$ или $s_2$, и числа аналогичных различных разбиений $s_1$ и $s_2$, расстояние между которыми увеличивается при добавлении к ним синонима $w$.
\end{definition}
Определим \textbf{степень центральности синонима} $w$ в синсете $S$ (centrality) через процедуру вычисления этой степени:
\begin{enumerate}
\item $S \setminus w$~--- обозначим синсет $S$ без слова $w$
\item Пусть одним из разбиений $S \setminus w$ является пара подмножеств $l_1$ и $l_2$, т.е. $S \setminus w = l_1 \sqcup l_2$.
\item Для такого разбиения $l_1 \sqcup l_2$ вычислим:
\begin{enumerate}
\item $sim_0 = distance (l_1, l_2)$
\item $sim_1 = distance (l_1 \cup w, l_2)$ // слово $w$ добавляется к первому подмножеству $l_1$
\item $sim_2 = distance (l_1, l_2 \cup w)$ // слово $w$ добавляется ко второму подмножеству $l_2$
\item $\Delta centrality_ = (sim_1 - sim_0) + (sim_2 - sim_0)$
\end{enumerate}
\item $centrality = \sum \Delta centrality_i$, где $i$ задаёт обход по всем возможным разбиениям $S \setminus w$ на два непустых множества
\end{enumerate}
\textbf{Гипотеза 2:} чем более многозначным является слово, тем меньше ранг ($\mathbb{Z}$) и степень центральности ($\mathbb{R}$) этого слова в разных синсетах.
Дан синсет (баюкать, убаюкивать, укачивать, усыплять). Подсчитаем ранг и степень центральности слова "усыплять" в этом синсете (Рис.~1).
Итоговое значения ранга для слова "усыплять" в этом синсете -1, степень центральности -0,071.