О курсе
В отличие от классического машинного обучения и статистической теории обучения, в обучении с подкреплением (ОсП) на вход не поступает обучающая выборка объектов-прецедентов. Тем не менее, современные алгоритмы глубокого обучения с подкреплением способны решать задачи искусственного интеллекта методом проб и ошибок без использования каких-либо априорных знаний о решаемой задаче, нередко добиваясь прорывных результатов в прикладной области: автоматическое пилотирование транспортных средств, робототехника, игровой искусственный интеллект, рекомендательные системы, диалоговые системы.
В предлагаемом курсе изучаются принципы работы основных алгоритмов ОсП, позволяющих достичь прорывных результатов во многих задачах: от игрового искусственного интеллекта до робототехники. Все необходимые теоретические результаты приводятся с доказательствами, использующими единый подход, унифицированные обозначения и определения.
Основная задача курса — не только предоставить актуальную информацию о задачах обучения с подкреплением и алгоритмах их решения, но и разъяснить разницу между алгоритмами различного вида и причины их представления в конкретных формах. Курс содержит как обсуждение базовых вопросов обучения с подкреплением, так и разбор задач.
Ведущие курса
Никита Евгеньевич Юдин, научный сотрудник лаборатории, старший преподаватель кафедры математических основ управления
По всем вопросам можно обращаться по почте.: iudin.ne@phystech.edu