Andrew Krizhanovsky rm dash  almost 8 years ago

Commit id: b0d934c8c52de76b30092b6dadbbfbeb1200a072

deletions | additions      

       

\subsection{Ранг и центральность слов в синсете}  Введём понятие \textbf{ранга синонима} $v\in S$.  Дизъюнктное разбиение на два множества, элемента разбиения, будем называть разбиением. Пусть $P_v= \{p_i, i=1,...,2^{n-2}-1\}$~--- множество всех пронумерованных каким-либо образом разбиений $(n-1)$--элементного $(n-1)$ элементного  множества $S\setminus \{v\}$, $n>2$. Рассмотрим какое-либо разбиение $p_i$ множества $S \setminus \{v\}$ на подмножества $S_1$ и $S_2$, то есть $S \setminus \{v\} = S_1 \sqcup S_2$. 

$(sim^1_i - sim_i) \cdot (sim^2_i - sim_i) < 0$   эквивалентно и является компактной записью для   $(sim^1_i < sim_i \wedge sim^2_i > sim_i) \bigvee (sim^1_i > sim_i \wedge sim^2_i < sim_i)$.   Другими словами словами,  функция $r_v (p_i)$ дает значение $0$, если добавление слова $v$ к  одному из элементов разбиения $p_i$ уменьшает (увеличивает) расстояние $sim_i$, а добавление ко второму элементу~--- наоборот~--- элементу наоборот  увеличивает (уменьшает) расстояние $sim_i$. То есть элемент $v$ действует на множества в "противофазе". На рис.~\ref{fig:SynsetSetsRank} это разбиения 2 и 3. \begin{definition}  Рангом синонима $v \in S$, где $|S| > 2,$ называется целое число вида 

\end{equation}  \end{definition}  Легко видеть, что если $v \in Int S$, то $rank\ (v) = 2^{|S|-2}-1$ -- это число всех непустых дизъюнктных разбиений $(|S|-1)-$элементного $(|S|-1)$ элементного  множества $S\setminus \{v\}$, т.е. т.~е.  $rank\ (v)$ максимален и совпадает с числом Стирлинга второго рода: $\textstyle \lbrace{n\atop k}\rbrace = \lbrace{|S|\atop 2}\rbrace$, где n~--- мощность разбиваемого множества, а k~--- число подмножеств, здесь два~\cite[с.~24]{Baranov_Stechkin_2004}. Взаимосвязь $IntS$ и ранга синонима в синсете $S$ сформулируем в виде теоремы. 

\begin{definition}  Центральностью синонима $v \in S$ при разбиении $p_i$ множества $S\setminus \{v\}$ называется величина   $$  centrality (v, p_i) = (sim^1_i(v) - sim_i) + (sim^2_i(v)- sim_i) sim_i).  $$  \end{definition} 

\begin{definition}  Центральностью синонима $v \in S$ называется величина  $$  centrality (v)= \sum_{i=1}^{|P_v|}centrality (v, p_i) p_i).  $$  \end{definition}