Козиев Илья (kelijah) wrote,
Козиев Илья
kelijah

Categories:

Генерация форм существительных с помощью GPT-2

Генерация определений слов с помощью GPT-2 и толкового словаря описана в этом посте.
Продолжим забивать языковые гвозди микроскопом!

Я обучил GPT-2 на парадигмах существительных из грамматического словаря. В обучающий датасет взято около 110 тысяч существительных, в каждом по 6 падежных форм для единственного числа. Модель училась из номинатива выдавать остальные 5 форм - родительный, творительный, винительный, дательный и предложный.

Примеры генерации:



  им                  род             твор            вин             дат            предл

Крутва         ==> Крутвы          Крутвою          Крутву         Крутве          Крутве
мыпутеривание  ==> мыпутеривания   мыпутериванием   мыпутеривание  мыпутериванию   мыпутеривании
абрхюбывание   ==> абрхюбывания    абрхюбыванием    абрхюбывание   абрхюбыванию    абрхюбывании
кунчатость     ==> кунчатости      кунчатостью      кунчатость     кунчатости      кунчатости
клишок         ==> клишка          клишком          клишок         клишку          клишке
Гуринуевка     ==> Гуринуевки      Гуринуевкою      Гуринуевку     Гуринуевке      Гуринуевке
авточщик       ==> авточщика       авточщиком       авточщика      авточщику       авточщике
сценеколог     ==> сценеколога     сценекологом     сценеколога    сценекологу     сценекологе
хознаций       ==> хознация        хознацием        хознаций       хознацию        хознации
разентировка   ==> разентировки    разентировкою    разентировку   разентировке    разентировке
эмище          ==> эмища           эмищем           эмище          эмищу           эмище
финоокричница  ==> финоокричницы   финоокричницею   финоокричницу  финоокричнице   финоокричнице
изатрона       ==> изатроны        изатроною        изатрону       изатроне        изатроне
ротанчик       ==> ротанчика       ротанчиком       ротанчик       ротанчику       ротанчике
тозачелка      ==> тозачелки       тозачелкою       тозачелку      тозачелке       тозачелке
отжимность     ==> отжимности      отжимностью      отжимность     отжимности      отжимности
веродифоция    ==> веродифоции     веродифоцией     веродифоцию    веродифоции     веродифоции
вейфанет       ==> вейфанета       вейфанетом       вейфанет       вейфанету       вейфанете
раздыв         ==> раздыва         раздывом         раздыва        раздыву         раздыве
Шысово         ==> Шысова          Шысовым          Шысово         Шысову          Шысове
сивофиксулятор ==> сивофиксулятора сивофиксулятором сивофиксулятор сивофиксулятору сивофиксуляторе



Нужно еще добавить модель определения ударения и можно генерить Викисловарь.
Tags: gpt-2, генеративная модель, генерация текста, словарные статьи, существительное
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 0 comments