Andrew Krizhanovsky added section_textbf_v_in_S__.tex  about 8 years ago

Commit id: afd0830f9caa3a25c777af17b5e6d18e008eae90

deletions | additions      

         

\section{Ранг и центральность слов в синсете}  Введём понятие \textbf{ранга синонима} $v\in S$.  Дизъюнктное разбиение на два множества, элемента разбиения, будем называть разбиением. Пусть $P_v= \{p_i, i=1,...,2^{n-2}-1\}$~--- множество всех пронумерованных каким-либо образом разбиений $(n-1)$--элементного множества $S\setminus v$, $n>2$.  Рассмотрим какое-либо разбиение $p_i \in P_v$ с элементами $\{v_{i_s}\}$ и $\{v_{j_p}\}$. Обозначим $sim_i=sim(\{v_{i_s}\}, \{v_{j_p}\})$,   $sim_i(v,1)=sim(\{v_{i_s}, v_l\}, \{v_{j_p}\})$,  $sim_i(v, 2)=sim(\{v_{i_s}\}, \{v_{j_p}, v_l\})$.  Введем функцию $r: P_v\rightarrow \{-1, 0, 1\}$. Пусть $r(p_i)= -1$, если $(sim_i > sim_i(v,1)) \wedge (sim_i > sim_i(v,2))$, $r(p_i)= 1$, если $(sim_i < sim_i(v,1)) \wedge (sim_i < sim_i(v,2))$, $r(p_i)= 0$, если   добавление   слова $v$ к каждому из элементов разбиения $p_i$ уменьшает, увеличивает расстояние $sim_i$ или добавление к одному элементу увеличивает, а к другому -- уменьшает расстояние $sim_i$, соответственно.  СМЫСЛ РАНГА И ЦЕНТРАЛЬНОСТИ.  \begin{definition}  Рангом синонима $v \in S$, где $|S| > 2,$ называется целое число вида  $$  rank\ v = \sum_{i=1}^{|P_v|} r(p_i).  $$  \end{definition}  Легко видеть, что если $v \in Int S$, то $rank\ v = d = 2^{|S|-2}-1$ -- это число всех непустых дизъюнктных разбиений $(|S|-1)-$элементного множества $S\setminus v$, т.е. $rank\ v$ максимален и совпадает с числом Стирлинга второго рода: $\textstyle \lbrace{n\atop k}\rbrace = \lbrace{|S|\atop 2}\rbrace$, где n~--- мощность разбиваемого множества, а k~--- число подмножеств, здесь два.  \begin{definition}  Центральностью синонима $v \in S$ при разбиении $p_i$ множества $S\setminus \{v\}$  $$  centrality (v, p_i) = (sim_i(v,1) - sim_i) + (sim_i(v,2)- sim_i)  $$   \end{definition}  \begin{definition}  Центральностью синонима $v \in S$ называется величина  $$  centrality (v)= \sum_{i=1}^{|P_v|}centrality (v, p_i)  $$  \end{definition}  Центральность дает более точную характеристику значимости слова $v$ в синсете, чем ранг.