Andrew Krizhanovsky + news corpus name  almost 8 years ago

Commit id: ff9a20cc873b7aba41cfe9e715cf57f6453ea312

deletions | additions      

       

\section{Эксперименты}  В этой работе используются нейронные модели, созданные разработчиками $RusVectores$~\cite{Kutuzov_2015}. А именно:две модели:  модель, построенная по текстам Национального корпуса русского языка (НКРЯ), (НКРЯ, Ruscoprora),  и модель, созданная на основе текстов отечественных новостных сайтов. сайтов (Новостной корпус, News corpus).  Авторы $RusVectores$ А.~Кутузов и Е.~Кузьменко обращают внимание читателя на такие особенности НКРЯ, как ручной отбор текстов для пополнения корпуса и регулирование соотношения текстов разных жанров, малый размер основного корпуса, порядка 107 млн слов (сколько в новостном?).   В работе~\cite{Kutuzov_2015} вводится понятие \textit{представительность корпуса} как способность отражать (указывать на) те ассоциации для слова, с которыми согласится большинство носителей.