this is for holding javascript data
Andrew Krizhanovsky added section_textbf_v_in_S__.tex
about 8 years ago
Commit id: afd0830f9caa3a25c777af17b5e6d18e008eae90
deletions | additions
diff --git a/section_textbf_v_in_S__.tex b/section_textbf_v_in_S__.tex
new file mode 100644
index 0000000..7108942
--- /dev/null
+++ b/section_textbf_v_in_S__.tex
...
\section{Ранг и центральность слов в синсете}
Введём понятие \textbf{ранга синонима} $v\in S$.
Дизъюнктное разбиение на два множества, элемента разбиения, будем называть разбиением. Пусть $P_v= \{p_i, i=1,...,2^{n-2}-1\}$~--- множество всех пронумерованных каким-либо образом разбиений $(n-1)$--элементного множества $S\setminus v$, $n>2$.
Рассмотрим какое-либо разбиение $p_i \in P_v$ с элементами $\{v_{i_s}\}$ и $\{v_{j_p}\}$. Обозначим $sim_i=sim(\{v_{i_s}\}, \{v_{j_p}\})$,
$sim_i(v,1)=sim(\{v_{i_s}, v_l\}, \{v_{j_p}\})$,
$sim_i(v, 2)=sim(\{v_{i_s}\}, \{v_{j_p}, v_l\})$.
Введем функцию $r: P_v\rightarrow \{-1, 0, 1\}$. Пусть $r(p_i)= -1$, если $(sim_i > sim_i(v,1)) \wedge (sim_i > sim_i(v,2))$, $r(p_i)= 1$, если $(sim_i < sim_i(v,1)) \wedge (sim_i < sim_i(v,2))$, $r(p_i)= 0$, если
добавление
слова $v$ к каждому из элементов разбиения $p_i$ уменьшает, увеличивает расстояние $sim_i$ или добавление к одному элементу увеличивает, а к другому -- уменьшает расстояние $sim_i$, соответственно.
СМЫСЛ РАНГА И ЦЕНТРАЛЬНОСТИ.
\begin{definition}
Рангом синонима $v \in S$, где $|S| > 2,$ называется целое число вида
$$
rank\ v = \sum_{i=1}^{|P_v|} r(p_i).
$$
\end{definition}
Легко видеть, что если $v \in Int S$, то $rank\ v = d = 2^{|S|-2}-1$ -- это число всех непустых дизъюнктных разбиений $(|S|-1)-$элементного множества $S\setminus v$, т.е. $rank\ v$ максимален и совпадает с числом Стирлинга второго рода: $\textstyle \lbrace{n\atop k}\rbrace = \lbrace{|S|\atop 2}\rbrace$, где n~--- мощность разбиваемого множества, а k~--- число подмножеств, здесь два.
\begin{definition}
Центральностью синонима $v \in S$ при разбиении $p_i$ множества $S\setminus \{v\}$
$$
centrality (v, p_i) = (sim_i(v,1) - sim_i) + (sim_i(v,2)- sim_i)
$$
\end{definition}
\begin{definition}
Центральностью синонима $v \in S$ называется величина
$$
centrality (v)= \sum_{i=1}^{|P_v|}centrality (v, p_i)
$$
\end{definition}
Центральность дает более точную характеристику значимости слова $v$ в синсете, чем ранг.