this is for holding javascript data
Andrew Krizhanovsky edited Experiments1.tex
almost 8 years ago
Commit id: e358b4e646163dd01198616acd581c11cc83b3cc
deletions | additions
diff --git a/Experiments1.tex b/Experiments1.tex
index 173a41b..e06f607 100644
--- a/Experiments1.tex
+++ b/Experiments1.tex
...
\section{Эксперименты}
В этой работе используются нейронные модели, созданные разработчиками $RusVectores$~\cite{Kutuzov_2015}. А именно: модель, построенная по текстам Национального корпуса русского языка (НКРЯ или Ruscoprora), и модель, созданная на основе текстов отечественных новостных сайтов (Новостной корпус или News corpus).
Модели доступны на сайте проекта RusVectores~\cite{Kutuzov_2015}.
Авторы $RusVectores$ А.~Кутузов и Е.~Кузьменко обращают внимание читателя на такие особенности НКРЯ, как ручной отбор текстов для пополнения корпуса и регулирование соотношения текстов разных жанров, малый размер основного корпуса, порядка 107 млн слов (сколько в новостном?).
В работе~\cite{Kutuzov_2015} вводится понятие \textit{представительность корпуса} как способность отражать (указывать на) те ассоциации для слова, с которыми согласится большинство носителей.
Проведены эксперименты для апробации предложенной модели синсета. Были использованы две матрицы $W$ (также их называют "модели"), построенные по корпусу НКРЯ и по Новостному корпусу.
todo gensim