В докладе представлю инструмент для аугментации текстовых данных, который включает в себя методы для добавления орфографических ошибок на основе статистик и эвристик и перефразирования текста на основе blackbox атаки на модель.
Everyone, backend-developer, project-manager, product-manager, team-lead, data-scientist, ml-engineer, engineers.
Any level.
Презентация (на Я.Диске)
Старший NLP-разработчик виртуальных ассистентов «Салют».
4+ года в сфере Data Science. Автор библиотек Augmentex и SAGE и модели ruElectra-large. Запустил собственное соревнование для студентов курса по NLP на ODS. Неоднократный победитель российских и международных хакатонов и соревнований. Ведёт телеграм-канал MarksRemarks, где популяризирует соревновательный DS.