Козиев Илья (kelijah) wrote,
Козиев Илья
kelijah

Category:

Собранные русские словарные базы и исполнимые файлы для Грамматического Словаря

В репозиторий https://github.com/Koziev/GrammarEngine выгружены полные актуальные сборки русской словарной базы для 64-битных Windows и Linux. Историческая ремарка - необходимость в разных версиях словаря под вин и лин объясняется такой замечательной особенностью C++, как отсутствие гараний размера основных типов данных. В частности, wchar_t для вин для большинства компиляторов имеет размер 2 байта, для лин - 4 байта.

Для начала использования под Windows вообще не нужно компилировать ничего - репозиторий содержит все необходимое. Если запустить exe64\lexicon.exe, то можно в консоли проверить поиск слов в лексиконе. Запустив scripts\syntax\console_syntax.cmd, можно посмотреть, как разбираются простые предложения в rule-based синтаксическом парсере. Пересборка словарной базы выполняется скриптом scripts\dictionary\russian.cmd

Для работы в Linux нужно собрать исполнимые файлы. Процесс сборки описан в README.md. Ничего особого там нет, просто набор приседаний со скачиванием и установкой зависимостей и запуском сборки в CMake.

Но есть и проблема - под VisualStudio 2017 перестал собираться один из компонентов Парсера.
Tags: грамматический словарь, русский язык
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 1 comment