Category: it

Category was added automatically. Read all entries about "it".

Немного мудрости от читчата

Из тестовой выдачи - моделька читчата генерит ответы на вопросы "что такое" и "кто такой":
Collapse )

Самое эпичное - творческий подход к морфологии, аппроксимация "пенал" до "пенальти" и то, что модель сделала с воротами:

- что такое пенал ?
- штрафной удар по воротамал .

Эксперименты с GPT-2 в чатботе

В тестовый стенд чатбота интегрирована модель GPT-2, дообученная на массиве диалогов. Общий объем диалогов после отфильтровывания мата и жаргона - около 1 Гб, в основном чит-чат. Процедуру обучения GPT-2 пришлось немного доработать, так как оригинальный код рассчитан на большие тексты, а у нас - короткие реплики.

Некоторые тестовые разговоры двух ботов:
Collapse )

Планы по чатботу

Итак, текущее состояние проекта чатбота зафиксировано в релизе 0.0.2.16. Вика стала многословней и чуточку лучше поддерживает чит-чат:
Collapse )
Иногда тестовый бот раскручивает Вику на диалоги из 20+ реплик (с ошибками, увы, над ними еще работать и работать):Collapse )
Что в планах?

1. Надо что-то делать с составными ответами. Например, для человека естественным является такой обмен репликами:

- как тебя зовут
- меня Витя, а тебя?

Collapse )

Регулярки как основа голосового UI

Небольшой рассказ о Марусе (голосовой ассистент mail.ru):
Collapse )
Интересный момент на 21:23, спикер сообщает что-то такое:

"из последних инсайтов, которые почерпнула ... когда пользователь говорит про погоду ... он например может использовать фразу 'сообщи погоду' ... почему 'сообщи'?

Вот прямо немного запахло регулярками в разборе запросов в Марусе.
И до этого несколько раз она же говорит вещи, подразумевающие сопоставление запроса с шаблонами по буквальному представлению.

Посидим рядком, початботим ладком: парное полуавтоматическое тестирование чатботов

Ручное тестирование чатбота постепенно становится обременительным из-за роста числа разных тем, которые поддерживает движок. В связи с этим было решено поручить "протыкивание" второму чатботу. Затем листинги бесед двух мудрецов можно просмотреть и выявить явные разрывы, нерелевантные ответы и так далее.

И важное техническое решение: средняя длина диалогов чит-чата, судя по всему, неплохо подходит в качестве оптимизируемой метрики. Простыми словами, чем дольше два бота беседуют до затыка (при отсутствии повторов реплик), тем лучше. Например, "беседа" длиной 17 реплик:

Collapse )

Полный листинг с сотней диалоговых сессий - тут.

Немного "шедевров" от генератора стихов для чит-чата

Чатбот не картошка, не выбросишь в окошко.

Чатбот дурака видит издалека.

Чатбот спать не даёт: хорошо живет.

Язык чешется, чатбот тешится.

(Предыдущие нетленки - тут)

Веб-интерфейс для чатбота

В релизе 0.0.2.14 восстановлен старый код веб-морды бота на фляшке. Теперь он запускается тоже в докере, как и консольный вариант. Для запуска нужно скачать образ, загрузить и запустить его командой:

docker image load -i chatbot.tar.gz
docker run -p 9001:9001 -it chatbot bash -c "/chatbot/scripts/flask_bot.sh"


Через несколько минут бот загрузится и выдаст в консоль сообщение с текстом:

werkzeug - * Running on http://0.0.0.0:9001/ (Press CTRL+C to quit)

Теперь можно открывать в браузере адрес http://127.0.0.1:9001/ и общаться с ботом, вводя запросы в простой веб-форме:
Collapse )

Релиз чатбота 0.0.2.13 - генеративный перефразировщик реплик и улучшение качества

Для чатбота в рамках релиза 0.0.2.13 подготовлено несколько улучшений.
Collapse )