Alexander Kirillov edited IntS.tex  about 8 years ago

Commit id: f1d71816b972fb3448feb8d068b4b5446d279a89

deletions | additions      

       

Таким образом, увеличение скалярного произведения соответствует уменьшению расстояния между векторами-словами $a, b$, которое принято обозначать как $sim\{a, b\}$, что является сокращением термина $similarity$ -- "похожесть" или "сходство" слов\footnote{Будем использовать фигурные скобки $sim\{a, b\}$, чтобы отличать запись от скалярного произведения $(\cdot, \cdot)$.}.  Итак, $sim\{a, b\} = \frac{ (a,b) }{ ||a|| \dot ||b|| }$~---~это расстояние между векторами $a$ и $b$.  Предлагаются и другие способы определения расстояния между словами-векторами (ССЫЛКИ), но в их основе также лежит скалярное произведение. произведение (Литература №№ 6 -- 8).  Введем обозначения для нормированных сумм векторов: $M((a_{i}),n)=\frac{\sum_{i=1}^n a_{i}}{||\sum_{i=1}^n a_{i}||}$. Расстояние между множествами векторов будем понимать как расстояния между средними векторов этих сумм. Таким образом, если даны два множества веторов $A=\{a_1,...,a_n\}$ и $B=\{b_1,...,b_m\}$, то расстояние между ними, $sim\{A, B\}$, определяется следующим образом $sim\{A, B\}=(M((a_i),n),(M((b_j),m))) $.