?

Log in

No account? Create an account

Компьютерная лингвистика

Новостная лента www.solarix.ru

Entries by tag: онлайн-словарь

Сжатие лексикона с потерями и без потерь
kelijah
Поправил алгоритм построения (или обучения - это как посмотреть) лемматизатора, и получилось, вроде бы, очень неплохо.

Read more...Collapse )

Коррекция опечаток как побочный эффект морфологического анализа
kelijah
Это действительно забавный побочный эффект, возникающих из-за особенностей нового алгоритма нечеткого поиска слов с опечатками.

Проще всего его пронаблюдать вживую на online анализаторе.

Read more...Collapse )

Переделки на сайте онлайн-словаря
kelijah
1. Убрал переключатель тем. Тормоза при обращении на jquery.com порядком достали, тем более что из-за этого временами подвисала загрузка страниц.

2. Подумываю, чтобы расширить онлайн-словарь добавлением в него английского раздела. Это позволит тестировать в онлайне морфоанализатор английского языка, раз уж он есть в проекте и вполне нормально работает в рамках реализованного объема английского синтаксиса.

Сейчас залил на сервер самую свежую версию словаря, с последними изменениями: работа с распространенными опечатками, учет при морфоанализе не-словарных текстовых единиц, использование регулярных выражений.

Думаю, работа с ФИО впишется в имеющиеся возможности и не потребует изменений в движке.

Из важных структурных изменений осталось переделать синтаксический анализатор, точнее - построение синтаксического графа.