Обучение с подкреплением, весна 2023

Весенний семестр, среда, с 10:45 по 13:00
УЛК-1 № 4.18-5.17

О курсе

На курсе изучаются принципы работы основных алгоритмов ОсП, позволивших достичь прорывных результатов во многих задачах: от игрового искусственного интеллекта до робототехники. Все необходимые теоретические результаты приводятся с доказательствами, использующими единый подход, унифицированные обозначения и определения.

Задачи курса — предоставить актуальную информацию о задачах обучения с подкреплением и алгоритмах их решения, а также разъяснить разницу между алгоритмами различного вида и причины их представления в конкретных формах. На занятиях студенты смогут обсудить базовые вопросы обучения с подкреплением, а также разобрать задачи с преподавателем.

Чтобы освоить курс, слушателю нужно владеть основами теории вероятностей, численных методов оптимизации, программирования на языке Python, а также ознакомиться с пакетами прикладных программ для математического моделирования на языке программирования Python: SciPy, NumPy, Matplotlib, Scikit-learn, PyTorch, OpenAI Gym.

Ведущие курса

Никита Евгеньевич Юдин, E-mail: iudin.ne@phystech.edu

Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.