DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method
Автор: ODS AI Ru
Загружено: 2022-11-01
Просмотров: 3502
Курс Deep Reinforcement Learning: https://ods.ai/tracks/drlcourse22
Сезон курсов: https://ods.ai/events/course_season_a...
В первой лекции:
Раскрывается содержательная идея принципа обучения с подкреплением.
Описывается математически строгая постановка задачи обучения с подкреплением в терминах марковских процессов принятия решений.
Рассматриваются примеры задач, которые могут быть формализованы в рамках этой постановки.
Обсуждается понятие политики агента.
При дополнительных ограничениях, исследуется взгляд на задачу обучения с подкреплением как на задачу конечномерно математической оптимизации. Опираясь на это, приводится эволюционный алгоритм Кросс-энтропии, должным образом модифицированный в соответствии с особенностями задачи обучения с подкреплением.
Обсуждаются недостатки этого алгоритма и способы их преодоления.
Наши соц.сети:
Telegram: https://t.me/datafest
Вконтакте: https://vk.com/datafest
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: