L4 TRPO and PPO (Foundations of Deep RL Series)
Автор: Pieter Abbeel
Загружено: 2021-08-24
Просмотров: 46619
Lecture 4 of a 6-lecture series on the Foundations of Deep RL
Topic: Trust Region Policy Optimization (TRPO) and Proximal Policy Optimization (PPO)
Instructor: Pieter Abbeel
Slides: https://www.dropbox.com/s/bodgpysmm6l...
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: