Козиев Илья (kelijah) wrote,
Козиев Илья
kelijah

Category:

Планы по чатботу

Итак, текущее состояние проекта чатбота зафиксировано в релизе 0.0.2.16. Вика стала многословней и чуточку лучше поддерживает чит-чат:


Иногда тестовый бот раскручивает Вику на диалоги из 20+ реплик (с ошибками, увы, над ними еще работать и работать):
B: Привет, буду рада ответить на вопросы
H: ага
B: что будем обсуждать?
H: что ты такое?
B: я чатбот
B: Скажи, пожалуйста, кто ты?
H: я человек
B: Я не удивлена
B: Это не удивительно
B: Теперь мы знаем, кто из нас кто
H: кто же я, по-твоему?
B: нет необходимой информации
H: печально
B: Ничего не поделаешь.
H: ты можешь научиться чему-то новому?
B: у меня нет нужной информации
H: ты глупая
B: Ой, мне такие слова не нравятся
H: а что тебе нравится?
B: Я люблю математику
H: почему?




Что в планах?

1. Надо что-то делать с составными ответами. Например, для человека естественным является такой обмен репликами:

- как тебя зовут
- меня Витя, а тебя?

Вторая реплика тут на самом деле содержит 2 фрагмента - ответ на вопрос и встречный вопрос. И как нетрудно заметить, вопрос сформулирован кратко. Человек обоснованно рассчитывает, что собеседник может легко восстановить опущенные детали из оперативного контекста и понять вопрос как "тебя как зовут?". Можно, конечно, строго-настрого "обучать" пользователя разбивать свои реплики на фрагменты явно. Действительно, умение переходить на упрощенный языковой регистр - одна из важных языковых компетенций, и люди ее используют при общении с детьми, с иностранцами и так далее. Но априори пользователю необходимость перехода на упрощенный прагматику может быть не очевидна, так как вживую он собеседника не видит, знакомство в чате только началось. Если бот начинает тупить, то многие пользователи просто перейдут на стиль общения с поисковиками "скачать курс английского pdf" или вообще не станут общаться.

Манипуляциями с краткими вопросами, а также с эллипсисом, анафорой, гэппингом, у нас занимается Интерпретатор. Сейчас он обучается на ~33 тысячах примерах. По плану мы попробуем возложить миссию по сегментации реплик на клаузы именно на него, поскольку он уже обучается разбираться в контексте диалога.

2. Перефразировки и стилизация. Сейчас перефразировщик просто вносит вариативность в ответы бота. Например, для "меня зовут Вика" он может выдать "мое имя - Вика" и так далее. Архитектурно эта модель подходит также на роль стилизатора. Например, если пользователь потребовал обращаться к нему на "Вы", то нерационально переобучать все генеративные модели и переписывать правила. Проще учесть такой флаг при постпроцессинге реплик бота, заменяя глаголы и местоимения на 2 лицо множественного числа. Эта же модель может делать ответы бота более вежливыми или грубоватыми, упрощать лексику и так далее, в том числе в зависимости от текущего эмоционального состояния самого бота и собеседника (благо оценка сентимента в боте уже есть).
Tags: chatbot, chitchat, текущие планы, чатбот, читчат
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 0 comments