Andrew Krizhanovsky edited Experiments1.tex  almost 8 years ago

Commit id: 17b2cceb2c48a1e153f7a8f21f3aa4e2c6254b3c

deletions | additions      

       

\section{Эксперименты}  В этой работе используются нейронные модели, созданные авторами проекта $RusVectores$~\cite{Kutuzov_2015}. $RusVectores$~\cite{Kutuzov_Andreev_2015}.  А именно: модель, построенная по текстам Национального корпуса русского языка (НКРЯ или Ruscoprora), и модель, созданная на основе текстов отечественных новостных сайтов (Новостной корпус или News corpus). Модели доступны на сайте проекта $RusVectores$~\cite{Kutuzov_2015}. $RusVectores$~\cite{Kutuzov_Andreev_2015}.  Авторы $RusVectores$ А.~Кутузов и Е.~Кузьменко обращают внимание читателя на такие особенности НКРЯ,   как ручной отбор текстов для пополнения корпуса и регулирование соотношения объема текстов разных жанров, малый размер основного корпуса, порядка 107 млн слов (для сравнения Новостной корпус включает 2.4 млрд токенов).