О курсе
На курсе изучаются принципы работы основных алгоритмов ОсП, позволивших достичь прорывных результатов во многих задачах: от игрового искусственного интеллекта до робототехники. Все необходимые теоретические результаты приводятся с доказательствами, использующими единый подход, унифицированные обозначения и определения.
Задачи курса — предоставить актуальную информацию о задачах обучения с подкреплением и алгоритмах их решения, а также разъяснить разницу между алгоритмами различного вида и причины их представления в конкретных формах. На занятиях студенты смогут обсудить базовые вопросы обучения с подкреплением, а также разобрать задачи с преподавателем.
Чтобы освоить курс, слушателю нужно владеть основами теории вероятностей, численных методов оптимизации, программирования на языке Python, а также ознакомиться с пакетами прикладных программ для математического моделирования на языке программирования Python: SciPy, NumPy, Matplotlib, Scikit-learn, PyTorch, OpenAI Gym.
Ведущие курса
Никита Евгеньевич Юдин, E-mail: iudin.ne@phystech.edu