Andrew Krizhanovsky style: further  almost 8 years ago

Commit id: 545fecda2fe07ba80e3be443ed26c393141bd7cc

deletions | additions      

       

Отметим, что понятие \textit{сбалансированность корпуса} приобретает новое значение в свете предсказательных моделей, создаваемых на основе корпуса. Несбалансированная выборка текстов приводит к перевесу в тематике корпусов, в итоге~--- к менее точной предсказательной модели.  Для последующих дальнейших  экспериментов важно следующее наблюдение работы~\cite{Kutuzov_2015}. Чем более слово является редким, чем меньше данных, контекстов с этим словом, тем более сомнительными, неточными будут ассоциативные слова, порождаемые предсказательной моделью. Нами проведены эксперименты для апробации предложенной модели синсета. Были использованы две матрицы $W$ (предсказательные модели),   построенные авторами $RusVectores$ по корпусу НКРЯ и по Новостному корпусу.