?

Log in

No account? Create an account

Компьютерная лингвистика

Новостная лента www.solarix.ru

Previous Entry Share Next Entry
Первый бенчмарк английского Парсера
kelijah
Собрана морфологическая модель (part-of-speech tagger) и синтаксическая модель (восходящий парсер) для английского языка по относительно небольшому корпусу.
Эти модели подключены в Парсере, который ранее бегал с русской словарной базой. Теперь, значит, он умеет работать и с английскими текстами.
Итог тестового забега с морфологическим и синтаксическим разбором:

Done, sentence_count=10000, elapsed_time=207 sec, rate=484.353 words/sec

В принципе, близкие цифры у меня получаются и для русских языковых моделей.