this is for holding javascript data
Andrew Krizhanovsky edited WVR.tex
almost 8 years ago
Commit id: 93b191f87f73ac889ef524099736d1a9ecc7af37
deletions | additions
diff --git a/WVR.tex b/WVR.tex
index c39b3b4..d26408f 100644
--- a/WVR.tex
+++ b/WVR.tex
...
\section{Векторное представление слов: блеск и нищета построения нейронных сетей инструментом word2vec}
Идея векторного представления слов с помощью нейронных сетей получила мощный толчок благодаря работам чешского ученого Томаса Миколова (\cite{Mikolov2012}, \cite{Mikolov2011} + todo ref статья 2013 г.:см. Литература № 3). Главное достоинство работы Т.~Миколова в том, что он разработал инструмент \textit{word2vec} для создания моделей нейронных сетей (далее будем их называть \textit{NN-моделями}) на основе текстов корпусов. Забегая вперед можно сказать, что, с нашей точки зрения, не меньший вклад сделали и отечественные ученые Андрей Кутузов и Елизавета Кузьменко, которые приготовили с помощью word2vec NN-модели для русского языка на основе ряда корпусов. Свой инструмент они назвали
RusVectores~\cite{Kutuzov2015}. RusVectores~\cite{Kutuzov_2015}.
Бедность подхода, предложенного Т.~Миколовым в том, что поиск осмысленных пар семантических отношений работает только на некоторых ярких примерах ($queen - woman + man \approx king$). Малейшее отклонение в сторону даёт неудовлетворительные результаты. Слабость математической стороны работ Т.~Миколова была подмечена в недавней работе Голдберга и Леви (todo см. Литература № 4).