Козиев Илья (kelijah) wrote,
Козиев Илья
kelijah

Category:

Регулярки против BERT'а

Тезис может показаться странным, но если подумать - это очевидно:

на задаче классификации интентов (и вообще на большинстве задач классификации текста) по метрике precision регулярные выражения безусловно бьют любое distributed представление (BERT, ELMO etc).

Именно это является причиной повсеместного использования регулярных выражений (и их вариаций) в диалоговых системах, особенно работающих в замкнутых доменах.

На метрике recall ситуация может быть разной, но обычно нужна именно точность в ущерб полноте, иначе бот начинает отвечать про Ерему, когда его спрашивают про Фому.
Tags: чатбот
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 0 comments