ЕКАТЕРИНА АРТЕМОВА
Natural Language Processing
О курсе
Курс посвящен основным задачам анализа и обработки текстов (natural language processing, NLP). Будут рассмотрены современные подходы к обработке текстов: векторизация слов и предложений на основе моделей дистрибутивной семантики, перенос обучения и активное обучение. Будут продемонстрированы возможности глубокого обучения для обработки текстов, в частности, современных языковых моделей (BERT, GPT2 и других).

Особое внимание уделяется практическим задачам, инструментам обработки текстов на русском языке и подготовке собственных наборов данных.


Команда курса
Екатерина Артемова
Лектор
Вероника Саркисян
Семинарист
Программа
Инструменты обработки текстов
Модели дистрибутивной семантики
  • Word2vec

  • FastText

  • Модели представления предложения
Языковые модели
  • Счетные языковые модели

  • Нейросетевые языковые модели

  • Модели Улицы Сезам

Классификация текстов
Кластеризация текстов
Разметка последовательности
Вопросно-ответные системы
Преобразование последовательностей (seq2seq)
Машинный перевод
Извлечение информации из текстов
Суммаризация и симплификация
Разметка текстовых данных и генерация синтетических наборов данных