Authorea

Andrew Krizhanovsky conslustion done almost 8 years ago

Commit id: fff92c076b930af434a87b183c87edd91110a915

deletions | additions

\section{Заключение и обсуждение} \section{Заключение} Под \textit{смыслом $M(S)$ синсета $S$} будем понимать совокупность (различных?) $Int S$, соответствующих подмножествам множества $S$. Целью формализации, предложенной в статье, является наведение мостов между лингвистикой и прикладной \textit{Степень близости} $\lambda (w, M(S))$ слова $w$ Мир современной линвистики можно условно представить в виде двух тяготеющих друг к смыслу $M(S)$~--- это число различных $Int S$ подмножеств синсета $S$, включающих слово $w$. Определим $\lambda \in \mathbb{N} \cup \{0\}$. другу, но слабосвязанных областей. Традиционная линвистика, работающая в основном с качественными понятиями, для формулировки четких определений базовых понятий (значение слова, синонимия), должна опираться на методы и алгоритмы вычислительной лингвистики (корпусная лингвистика, нейронные сети), дискретной математики, теории вероятносей. Пусть $w_1, w_2 \in S$ и степень близости слова $w_1$ к $M(S)$ больше, чем В нашей работе предлагается формализация такого важного для $w_2$. Тогда $\lambda (w_1, M(S)) > \lambda (w_2, M(S))$. машиночитаемых словарей и тезаурусов понятия как набор синонимов (синсет). К этой формализации синсета предлагается ряд вычислимых атрибутов (IntS, rank, centrality). Эти атрибуты позволяют анализировать синсеты, сравнивать их, проводить количественный анализ. Разработанный аппарат планируется применить к решению задачи разрешения лексической многозначности. Работа поддержана грантом РГНФ (проект \textnumero 15-04-12006).