Andrew Krizhanovsky + cite  almost 8 years ago

Commit id: 135adc548dca52b20be01713856d9e4229ca5413

deletions | additions      

       

Таким образом, увеличение скалярного произведения соответствует уменьшению расстояния между векторами-словами $a, b$, которое принято обозначать как $sim\{a, b\}$, что является сокращением термина $similarity$ -- "похожесть" или "сходство" слов\footnote{Будем использовать фигурные скобки $sim\{a, b\}$, чтобы отличать запись от скалярного произведения $(\cdot, \cdot)$.}.  Итак, $sim\{a, b\} = \frac{ (a,b) }{ ||a|| \dot ||b|| }$~---~это расстояние между векторами $a$ и $b$.  Предлагаются и другие способы определения расстояния между словами-векторами (ССЫЛКИ), словами-векторами,  но в их основе также лежит скалярное произведение (Литература №№ 6 -- 8). произведение~\cite{Sidorov_2014_Soft}, \cite{Levy_2015_Improving}, \cite{Mahadevan_2015_Reasoning}.  Введем обозначения для нормированных сумм векторов: $M((a_{i}),n)=\frac{\sum_{i=1}^n a_{i}}{||\sum_{i=1}^n a_{i}||}$. Расстояние между множествами векторов будем понимать как расстояния между средними векторов этих сумм. Таким образом, если даны два множества веторов $A=\{a_1,...,a_n\}$ и $B=\{b_1,...,b_m\}$, то расстояние между ними, $sim\{A, B\}$, определяется следующим образом $sim\{A, B\}=(M((a_i),n),(M((b_j),m))) $.