this is for holding javascript data
Andrew Krizhanovsky + cite
almost 8 years ago
Commit id: 135adc548dca52b20be01713856d9e4229ca5413
deletions | additions
diff --git a/IntS.tex b/IntS.tex
index ab0e0ea..14154ba 100644
--- a/IntS.tex
+++ b/IntS.tex
...
Таким образом, увеличение скалярного произведения соответствует уменьшению расстояния между векторами-словами $a, b$, которое принято обозначать как $sim\{a, b\}$, что является сокращением термина $similarity$ -- "похожесть" или "сходство" слов\footnote{Будем использовать фигурные скобки $sim\{a, b\}$, чтобы отличать запись от скалярного произведения $(\cdot, \cdot)$.}.
Итак, $sim\{a, b\} = \frac{ (a,b) }{ ||a|| \dot ||b|| }$~---~это расстояние между векторами $a$ и $b$.
Предлагаются и другие способы определения расстояния между
словами-векторами (ССЫЛКИ), словами-векторами,
но в их основе также лежит скалярное
произведение (Литература №№ 6 -- 8). произведение~\cite{Sidorov_2014_Soft}, \cite{Levy_2015_Improving}, \cite{Mahadevan_2015_Reasoning}.
Введем обозначения для нормированных сумм векторов: $M((a_{i}),n)=\frac{\sum_{i=1}^n a_{i}}{||\sum_{i=1}^n a_{i}||}$. Расстояние между множествами векторов будем понимать как расстояния между средними векторов этих сумм. Таким образом, если даны два множества веторов $A=\{a_1,...,a_n\}$ и $B=\{b_1,...,b_m\}$, то расстояние между ними, $sim\{A, B\}$, определяется следующим образом $sim\{A, B\}=(M((a_i),n),(M((b_j),m))) $.