Обучение с подкреплением, весна 2025

С 5 февраля по средам, 13:55 — 16:55

УЛК-1 (Физтех.Цифра), аудитория 5.18

О курсе

В отличие от классического машинного обучения и статистической теории обучения, в обучении с подкреплением (ОсП) на вход не поступает обучающая выборка объектов-прецедентов. Тем не менее, современные алгоритмы глубокого обучения с подкреплением способны решать задачи искусственного интеллекта методом проб и ошибок без использования каких-либо априорных знаний о решаемой задаче, нередко добиваясь прорывных результатов в прикладной области: автоматическое пилотирование транспортных средств, робототехника, игровой искусственный интеллект, рекомендательные системы, диалоговые системы.

В предлагаемом курсе изучаются принципы работы основных алгоритмов ОсП, позволяющих достичь прорывных результатов во многих задачах: от игрового искусственного интеллекта до робототехники. Все необходимые теоретические результаты приводятся с доказательствами, использующими единый подход, унифицированные обозначения и определения.

Основная задача курса — не только предоставить актуальную информацию о задачах обучения с подкреплением и алгоритмах их решения, но и разъяснить разницу между алгоритмами различного вида и причины их представления в конкретных формах. Курс содержит как обсуждение базовых вопросов обучения с подкреплением, так и разбор задач.

Ведущие курса

Никита Евгеньевич Юдин, научный сотрудник лаборатории, старший преподаватель кафедры математических основ управления

По всем вопросам можно обращаться по почте.: iudin.ne@phystech.edu