this is for holding javascript data
Andrew Krizhanovsky conslustion done
almost 8 years ago
Commit id: fff92c076b930af434a87b183c87edd91110a915
deletions | additions
diff --git a/Discussion.tex b/Discussion.tex
index 61124b1..11ca0a2 100644
--- a/Discussion.tex
+++ b/Discussion.tex
...
\section{Заключение и обсуждение} \section{Заключение}
Под \textit{смыслом $M(S)$ синсета $S$} будем понимать совокупность (различных?) $Int S$, соответствующих подмножествам множества $S$. Целью формализации, предложенной в статье, является наведение мостов между лингвистикой и прикладной
\textit{Степень близости} $\lambda (w, M(S))$ слова $w$ Мир современной линвистики можно условно представить в виде двух тяготеющих друг к
смыслу $M(S)$~--- это число различных $Int S$ подмножеств синсета $S$, включающих слово $w$. Определим $\lambda \in \mathbb{N} \cup \{0\}$. другу, но слабосвязанных областей.
Традиционная линвистика, работающая в основном с качественными понятиями,
для формулировки четких определений базовых понятий (значение слова, синонимия),
должна опираться на методы и алгоритмы вычислительной лингвистики (корпусная лингвистика, нейронные сети), дискретной математики, теории вероятносей.
Пусть $w_1, w_2 \in S$ и степень близости слова $w_1$ к $M(S)$ больше, чем В нашей работе предлагается формализация такого важного для
$w_2$.
Тогда $\lambda (w_1, M(S)) > \lambda (w_2, M(S))$. машиночитаемых словарей и тезаурусов понятия как набор синонимов (синсет).
К этой формализации синсета предлагается ряд вычислимых атрибутов (IntS, rank, centrality). Эти атрибуты позволяют анализировать синсеты, сравнивать их, проводить количественный анализ.
Разработанный аппарат планируется применить к решению задачи разрешения лексической многозначности.
Работа поддержана грантом РГНФ (проект \textnumero 15-04-12006).