?

Log in

No account? Create an account

Компьютерная лингвистика

Новостная лента www.solarix.ru

Entries by tag: соревнования

Черновики по задаче "Вопросно-ответная система на русском языке"
kelijah
Отстрелялся в задаче "Вопросно-ответная система на русском языке".
Исходники решения выложил в репозиторий https://github.com/Koziev/NLP_Comp/tree/master/SDSJ_A

Самый красивый, хотя и не самый точный, вариант - сеточная модель со сверточной и рекуррентной частями, написанная на питоне и Keras: https://github.com/Koziev/NLP_Comp/blob/master/SDSJ_A/models/nn5.py

Выложил черновики для HackerEarth Machine Learning Challenge #3
kelijah
Черновики и модели для HackerEarth Machine Learning Challenge #3 выложил в репозиторий. Я там под алиасом KozievElijah-Team.

Соревнование от SAS - банковский скоринг кредитных заявок (бинарная классификация)
kelijah
Страничка конкурса: http://sascompetitions.ru/competitions/forecasting-the-probability-of-non-repayment-of-loan
Конкурс появился и в списке текущих соревнований http://mltrainings.ru/?filter=active.
Описание задачи немного мутное, но вроде бы все сводится к бинарной классификации без особых заморочек.
Важный нюанс, который я выяснил в первом пробном сабмите, заключается в правильном форматировании файла сабмита. Записи в нем должны быть СТРОГО в порядке возрастания ID, иначе при сабмите получается нулевая оценка без каких-либо пояснений.
Тренировочный датасет содержит более миллиона сэмплов, так что можно поиграть с разными моделями. Я планирую попробовать стэкинг из brew и mlxtend.

NIPS 2017: Learning to Run: улучшенная модель
kelijah
Подготовил новую модель для соревнования "NIPS 2017: Learning to Run (Reinforcement learning environments with musculoskeletal models)", организатором которого является Stanford Neuromuscular Biomechanics Laboratory:
Умчался вдаль, гремя костями (видео)...Collapse )
Визуально модель слишком динамична, склонна к энергичным и высокоамплитудным движениям. Возможно, следует штрафовать ее за слишком активную работу мышц, причем постепенно усиливать штраф.

Исходники экспериментов с hyperopt
kelijah

К сожалению, финальный пересчет результатов ничего хорошего не принес. Все-таки игра свелась к "оверфит паблика и мне повезет".

Хорошая часть — более-менее ясно с оптимизацией LightGBM. Хотя там есть шероховатости в виде раздражающего спама отладочных сообщений в консоли от C++ ядра LightGBM, которое мне не удалось отключить. Ни задание параметров verbosity, ни переназначение stdout в питоновском коде, не избавляют от потока бессмысленных сообщений, которые просто мешают читать другую диагностику.

Часть исходников выложил в реп: https://github.com/Koziev/MLBootCampV

В частности, сочетание hyperopt и LightGBM есть тут.


ML BootCamp V: осталось 3 дня и 15 выстрелов
kelijah
Текущие результаты: http://mlbootcamp.ru/round/12/rating/
В запасе осталось 15 сабмитов, среди них может оказаться и удачный:Read more...Collapse )

Новое NLP соревнование на Кагле
kelijah

Personalized Medicine: Redefining Cancer Treatment

Чуточку экстремальное. В тренировочном наборе 3321 сэмпл, в тестовом - 5668. То есть вроде как совсем не густо.

Но каждый сэмпл содержит текст в несколько тысяч (максимум 81 тысячу) слов с неким описанием на английском языке.


Нейросетевые модели для определения перефразировок вопросов (7)
kelijah
[начало тут http://kelijah.livejournal.com/212124.html]

Часть 1 char-level deep neural networks

Read more...Collapse )

Планы по поводу ML BootCamp V
kelijah
Первоначальная задача-минимум для http://mlbootcamp.ru/round/12/tasks/ была: освоить тюнинг LightGBM, чтобы он выдывал результаты, сопоставимые с XGBoost.

Read more...Collapse )

Нейросетевые модели для определения перефразировок вопросов (6)
kelijah
[начало тут http://kelijah.livejournal.com/212124.html]
Оценки качества моделей, усреднение
Для каждой модели я даю оценку, которую видно при сабмите результатов расчета для тестового набора по ссылке https://www.kaggle.com/c/quora-question-pairs/submit.

Read more...Collapse )