Компьютерная лингвистика

Новостная лента www.solarix.ru

Утилита для полнотекстового поиска с индексированием (C# WPF+Lucene.NET + SQLite + nHibernate)
kelijah
Делаю для себя, так как периодически возникает необходимость поискать какой-то фрагмент текста в больших текстовых файлах (гигабайты или десятки гигабайтов). Текущая версия - макет с минимальным функцилналом.

Исходники на C# и проект для VS2015 лежат в репозитории https://github.com/Koziev/CorpusSearch.

Визуальная часть написана на WPF.
Полнотекстовый индекс и поиск - Lucene.NET.
Хранение метаинформации о проиндексированных файлах - Fluent NHibernate с SQLite.
Логирование - log4net.
В конфигурационном файле надо руками прописать путь к базе данных - см. строку Data Source=e:/tmp/CorpusSearch.sqlite.db;
Также надо задать путь к папке, где будут складироваться индексы Lucene - см. строку <add key="indexes" value="f:/temp/CorpusSearchIndexes" />
Дополнительно можно поменять путь к файлу с логом - искать по <file value="${APPDATA}/CorpusSearch.log" />, если дефолтное расположение в папке данных не устраивает.

?

Log in

No account? Create an account