Компьютерная лингвистика

Новостная лента www.solarix.ru

Previous Entry Share Next Entry
Пример использования таблицы aux_form в SQL словаре
kelijah
В новой версии SQL словаря появились новые таблицы, позволяющие точнее описывать различные языковые явления. Среди них - таблица aux_form, в которой хранятся дополнительные сведения о словоформах, то есть для таблицы sg_form.

Каждой записи в таблице sg_form может соответствовать множество записей в aux_form, связанных по ключевому полю (id_entry,iform).

Список типов дополнительных сведений сделан расширяемым. Типы объявляются в исходных текстах словаря и вносятся в справочник aux_form_types при его компиляции.

Связь этих таблиц можно продемонстрировать на примере вывода списка форм для русских местоимений с отображением буквы ё. В записях в sg_form буквы ё нет, так как в русском алфавите она сделана разновидностью буквы е и превращается в неё при нормализации словоформ в ходе компиляции. Чтобы сохранить ёфикацию, объявлен соответствующий тип записей для aux_form.

Теперь с помощью запроса, в данном примере для MS SQL:



мы получаем такую выборку:
грамматические формы для русских местоимений

Второй столбец содержит текст из таблицы sg_form, третий столбец с помощью стандартной функции Coalesce содержит либо данные из aux_form, когда они есть, либо текст из sg_form, так как для большинства форм задавать ёфикацию нет смысла.

?

Log in