?

Log in

No account? Create an account

Компьютерная лингвистика

Новостная лента www.solarix.ru

Entries by category: дети

Кластеризация предложений в векторном пространстве
kelijah
Если мы для каждого предложения умеем вычислять вектор фиксированной длины, то становится доступна и кластеризация. Именно кластеризация позволяет быстро проверить важную гипотезу,  что существует некоторое относительно небольшое количество предложений (словосочетаний, синтагм), описывающих некоторые типичные ситуации окружающей действительности и деятельности субъекта в этой действительности. Наличие таких текстовых архетипов позволит улучшить работу алгоритма семантического и синтаксического анализа текста, но об этом поговорим в отдельной главе.
Read more...Collapse )

Кто такой "бокренок" в "глокой куздре"?
kelijah
Анализируем слово "бокренка" в предложении "Глокая куздра штеко будланула бокра и курдячит бокрёнка" (см. пред. запись по теме).
Аспект первый - морфологический.
Вот ТОП-10 слов, ближайших по косинусу к аффиксу "~енка":
word2vector TOP 10....Collapse )

Бинго! Модель правильно ухватила и морфологический аспект "винительный падеж единственного числа одушевленного существительного", и даже семантический "ребенка".

Кастелянша и директриса
kelijah
В контексте родовых пар оба эти слова заставили покопаться в словарях, и вот почему.

Усатый нянь, кастеляны и Грамматиков ...Collapse )