Andrew Krizhanovsky + word2vec  almost 8 years ago

Commit id: 06727c10b2c09325ea2618881920851f01dbda2c

deletions | additions      

       

В работе~\cite{Kutuzov_2015} вводится понятие \textit{представительность корпуса} как способность отражать (указывать на) те ассоциации для слова, с которыми согласится большинство носителей.  Проведены эксперименты для апробации предложенной модели синсета. Были использованы две матрицы $W$ (также (будем  их называют "модели"), называть \textit{нейронные модели} или \textit{NN-модели}),  построенные по корпусу НКРЯ и по Новостному корпусу. Для работы с NN-моделями была выбрана программа gensim\footnote{\url{http://radimrehurek.com/gensim/}},   поскольку она в том числе содержит реализацию   word2vec на языке Python. Программа gensim описана в работе~\cite{rehurek_lrec}.  todo gensim