this is for holding javascript data
Alexander Kirillov edited IntS.tex
about 8 years ago
Commit id: f1d71816b972fb3448feb8d068b4b5446d279a89
deletions | additions
diff --git a/IntS.tex b/IntS.tex
index e2841b4..ab0e0ea 100644
--- a/IntS.tex
+++ b/IntS.tex
...
Таким образом, увеличение скалярного произведения соответствует уменьшению расстояния между векторами-словами $a, b$, которое принято обозначать как $sim\{a, b\}$, что является сокращением термина $similarity$ -- "похожесть" или "сходство" слов\footnote{Будем использовать фигурные скобки $sim\{a, b\}$, чтобы отличать запись от скалярного произведения $(\cdot, \cdot)$.}.
Итак, $sim\{a, b\} = \frac{ (a,b) }{ ||a|| \dot ||b|| }$~---~это расстояние между векторами $a$ и $b$.
Предлагаются и другие способы определения расстояния между словами-векторами (ССЫЛКИ), но в их основе также лежит скалярное
произведение. произведение (Литература №№ 6 -- 8).
Введем обозначения для нормированных сумм векторов: $M((a_{i}),n)=\frac{\sum_{i=1}^n a_{i}}{||\sum_{i=1}^n a_{i}||}$. Расстояние между множествами векторов будем понимать как расстояния между средними векторов этих сумм. Таким образом, если даны два множества веторов $A=\{a_1,...,a_n\}$ и $B=\{b_1,...,b_m\}$, то расстояние между ними, $sim\{A, B\}$, определяется следующим образом $sim\{A, B\}=(M((a_i),n),(M((b_j),m))) $.