Компьютерная лингвистика

Новостная лента www.solarix.ru

Previous Entry Share Next Entry
Нейросеточка для дописывания строк
kelijah
Играюсь с новой версией модели языка на уровне символов (код на питоне, в репозиторий залиты и файлы предобученной на небольшом корпусе модели).

Программа позволяет ввести начало строки и затем дополняет ее парой десятков символов, используя модель для вычисления вероятностей нового символа по предшествующим 64 символам. Вот такие штуки получаются (болдом выделен вводимая в консоли затравка):
eek@ubuntu:~/polygon/pushkin$ python char_generator.py

>: мойте руки пере
мойте руки передать о среднем пробл

>: поздравляю с новы
поздравляю с новыми войсками в из раз

>: кошка ловит мыш
кошка ловит мышленности и населения

>: и стоило ли так напрягать
и стоило ли так напрягать новым результате по

>: с добрым утр
с добрым утромании военные высок

>: сяду на пенек, съем пиро
сяду на пенек, съем пировой техников.


Надо эту вещь взамен штатного безобразия на андроид для ввода текста, а то тамошний предиктор так и норовит испортить текст вместо помощи.

?

Log in

No account? Create an account