Andrew Krizhanovsky CP-models  almost 8 years ago

Commit id: a287973d04bcf98ffdecc6f5737bf601d90a7b4a

deletions | additions      

       

Идея векторного представления слов с помощью нейронных сетей получила мощный толчок благодаря работам Томаса Миколова \cite{Mikolov_2011, Mikolov_2012, Mikolov_2013}. Главное достоинство работы Т.~Миколова в том, что он разработал инструмент \textit{word2vec} для создания моделей нейронных сетей   (далее будем их называть \textit{предсказательными моделями}, см. context-predicting models в работе~\cite{Baroni_2014})  на основе текстов корпусов.   Забегая вперед, можно сказать, что, с нашей точки зрения, не меньший вклад сделали и отечественные ученые Андрей Кутузов и Елизавета Кузьменко, которые приготовили с помощью word2vec CP-модели предсказательные модели  для русского языка на основе ряда корпусов. Свой инструмент они назвали RusVectores~\cite{RusVectores-website}. RusVectores~\cite{Kutuzov_Andreev_2015}.  Бедность подхода, предложенного Т.~Миколовым в том, что поиск осмысленных пар семантических отношений работает только на некоторых ярких примерах ($queen - woman + man \approx king$).   У нас есть обоснованные подозрения, что не на всём пространстве текстов