Andrew Krizhanovsky conslustion done  almost 8 years ago

Commit id: fff92c076b930af434a87b183c87edd91110a915

deletions | additions      

       

\section{Заключение и обсуждение} \section{Заключение}  Под \textit{смыслом $M(S)$ синсета $S$} будем понимать совокупность (различных?) $Int S$, соответствующих подмножествам множества $S$. Целью формализации, предложенной в статье, является наведение мостов между лингвистикой и прикладной  \textit{Степень близости} $\lambda (w, M(S))$ слова $w$ Мир современной линвистики можно условно представить в виде двух тяготеющих друг  к смыслу $M(S)$~--- это число различных $Int S$ подмножеств синсета $S$, включающих слово $w$. Определим $\lambda \in \mathbb{N} \cup \{0\}$. другу, но слабосвязанных областей.  Традиционная линвистика, работающая в основном с качественными понятиями,   для формулировки четких определений базовых понятий (значение слова, синонимия),  должна опираться на методы и алгоритмы вычислительной лингвистики (корпусная лингвистика, нейронные сети), дискретной математики, теории вероятносей.  Пусть $w_1, w_2 \in S$ и степень близости слова $w_1$ к $M(S)$ больше, чем В нашей работе предлагается формализация такого важного  для $w_2$.  Тогда $\lambda (w_1, M(S)) > \lambda (w_2, M(S))$. машиночитаемых словарей и тезаурусов понятия как набор синонимов (синсет).  К этой формализации синсета предлагается ряд вычислимых атрибутов (IntS, rank, centrality). Эти атрибуты позволяют анализировать синсеты, сравнивать их, проводить количественный анализ.  Разработанный аппарат планируется применить к решению задачи разрешения лексической многозначности.  Работа поддержана грантом РГНФ (проект \textnumero 15-04-12006).