Лекция 21 — Оптимизация и обучение для управления роботом — Обучение на основе временных различий

Автор: Andrea Del Prete

Загружено: 2025-11-14

Просмотров: 48

Описание:

В этой лекции мы завершаем обсуждение прогнозирования без использования моделей. Мы рассмотрим, как обучение по временным разностям (ВР) может быть использовано в качестве альтернативы Монте-Карло (МКР) для оценки функции ценности заданной политики. Мы проанализируем преимущества и недостатки ВР по сравнению с ТР, иллюстрируя некоторые из них на примерах.

Лекция 21 — Оптимизация и обучение для управления роботом — Обучение на основе временных различий

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Лекция 22 — Оптимизация и обучение для управления роботом — SARSA, Q-Learning

Лекция 22 — Оптимизация и обучение для управления роботом — SARSA, Q-Learning

Lecture 10 - Optimization and Learning for Robot Control - Trajectory Optimization: Direct Methods

Lecture 10 - Optimization and Learning for Robot Control - Trajectory Optimization: Direct Methods

Lecture 9 - Optimization and Leaning for Robot Control - Intro to Numerical Optimization

Lecture 9 - Optimization and Leaning for Robot Control - Intro to Numerical Optimization

Optimization and Learning for Robot Control 2025

Optimization and Learning for Robot Control 2025

Почему ABCABC никогда не сможет избежать 13 с @algebro1 | Теория чисел | Dogmathic x Algebro1

Почему ABCABC никогда не сможет избежать 13 с @algebro1 | Теория чисел | Dogmathic x Algebro1

Lecture 27 - Optimization and Learning for Robot Control - Policy Gradient Methods

Lecture 27 - Optimization and Learning for Robot Control - Policy Gradient Methods

[RU] Континентальная шахматная лига на lichess.org

[RU] Континентальная шахматная лига на lichess.org

Lecture 23 - Optimization and Learning for Robot Control - Implementing Monte Carlo and TD learning

Lecture 23 - Optimization and Learning for Robot Control - Implementing Monte Carlo and TD learning

Почему 2026 год ИЗМЕНИТ ВСЕ

Почему 2026 год ИЗМЕНИТ ВСЕ

Lecture 1 - Optimization and Learning for Robot Control - Introduction, overview and motivations

Lecture 1 - Optimization and Learning for Robot Control - Introduction, overview and motivations

Lecture 11 - Optimization and Learning for Robot Control - Model Predictive Control (part 1)

Lecture 11 - Optimization and Learning for Robot Control - Model Predictive Control (part 1)

Lecture 19 - Optimization and Learning for Robot Control - Dynamic Programming and Monte Carlo

Lecture 19 - Optimization and Learning for Robot Control - Dynamic Programming and Monte Carlo

Lecture 25 - Optimization and Learning for Robot Control - Value function approximation

Lecture 25 - Optimization and Learning for Robot Control - Value function approximation

Высшее образование с отработкой | Новая реальность — пока для медиков (English subtitles) @Max_Katz

Высшее образование с отработкой | Новая реальность — пока для медиков (English subtitles) @Max_Katz

Птаха у Дудя: «Я был на Донбассе» | Почему этот аргумент не работает (English subtitles) @Max_Katz

Птаха у Дудя: «Я был на Донбассе» | Почему этот аргумент не работает (English subtitles) @Max_Katz

«Эффект Цекало»: как создать «русский Netflix», но остаться в тени? | Портреты

«Эффект Цекало»: как создать «русский Netflix», но остаться в тени? | Портреты

НДС 22%: НАЛОГ на банковские карты?

НДС 22%: НАЛОГ на банковские карты?

Lecture 18 - Optimization and Learning for Robot Control - Markov Decision Processes

Lecture 18 - Optimization and Learning for Robot Control - Markov Decision Processes

Как Никита Михалков всех обманул. Тайная жизнь «Бесогона»

Как Никита Михалков всех обманул. Тайная жизнь «Бесогона»

«Много врал» ради славы и бабла: как Арестович стал врагом и Киева, и Москвы

«Много врал» ради славы и бабла: как Арестович стал врагом и Киева, и Москвы