Andrew Krizhanovsky edited RusVectores_gensim_ruwikt.tex  almost 8 years ago

Commit id: 025dc0ece7c5fe1721f38d4c90ffdd4c25749c30

deletions | additions      

       

Для исследования были использованы синонимы онлайн-словаря Русский Викисловарь. Викисловарь~--- это свободно пополняемый многофункциональный многоязычный онлайн-словарь и тезаурус. В Викисловаре содержатся толкования и переводы слов, описание фонетических и морфологических свойств, семантические (парадигматические) отношения. В словарных статьях приводится произношение слов (указана транскрипция и даны ссылки на аудиофайлы с произношением), правила разбиения слов на слоги, ударения в словах, информация об этимологии слов. Машиночитаемый Викисловарь, используемый в этой работе, регулярно обновляется и строится на основе данных Русского Викисловаря~\cite{Krizhanovsky_Smirnov_2013}. Машинночитаемая версия Викисловаря создается в проекте wikokit~\footnote{URL: \url{https://github.com/componavt/wikokit}.}  Сказать: сколько синсетов в Викисловаре, сослаться на работу про 12 словарей todo cite.  + Ссылка на работу RadimHurek (Gensim).