Augmentex: библиотека для аугментации вашего текста
Data Science/ML/AI

Тезисы

В докладе представлю инструмент для аугментации текстовых данных, который включает в себя методы для добавления орфографических ошибок на основе статистик и эвристик и перефразирования текста на основе blackbox атаки на модель.


Аудитория

Everyone, backend-developer, project-manager, product-manager, team-lead, data-scientist, ml-engineer, engineers.


Уровень сложности

Any level.

Презентация (на Я.Диске)

Записи выступлений доступны платным участникам CodeFest
В свободном доступе появятся через пол года

Залогиниться

SberDevices

Марк Баушенко

Старший NLP-разработчик виртуальных ассистентов «Салют».

4+ года в сфере Data Science. Автор библиотек Augmentex и SAGE и модели ruElectra-large. Запустил собственное соревнование для студентов курса по NLP на ODS. Неоднократный победитель российских и международных хакатонов и соревнований. Ведёт телеграм-канал MarksRemarks, где популяризирует соревновательный DS.

Старший NLP-разработчик виртуальных ассистентов «Салют».

4+ года в сфере Data Science. Автор библиотек Augmentex и SAGE и модели ruElectra-large. Запустил собственное соревнование для студентов курса по NLP на ODS. Неоднократный победитель российских и международных хакатонов и соревнований. Ведёт телеграм-канал MarksRemarks, где популяризирует соревновательный DS.

Еще на тему Data Science/ML/AI