Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Robot Learning: Goal-Condition Panning

Автор: Montreal Robotics

Загружено: 2025-03-24

Просмотров: 252

Описание:

Many recent foundational model papers use goal conditioning and hierarchical planning. What are the best methods for training these models? What goal distribution is best for training? How can we think about the generalization that will enable better model reuse? In this lecture, I connect these concepts to foundational models to get more detailed background.

I talk about how traditional RL can struggle with long trajectories and complex tasks, like cooking soup, where you have many smaller, repetitive actions. I suggested that instead of training separate policies for each action, we could use a single policy conditioned on a goal. Initially, we looked at using one-hot encoded vectors as context, but that doesn't scale well and can't handle combinations of tasks. Then, we discussed using a continuous representation of the goal, which is more efficient and flexible. This approach, where the goal is represented in the same space as the state, allows the agent to learn a single policy that can achieve a wide range of goals. We also touched on how this goal-conditioned approach helps with reusability and robustness, since the policy learns to handle variations within the task.

Robot Learning: Goal-Condition Panning

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Robot Learning: Visual Goal-Condition Reinforcement Learning

Robot Learning: Visual Goal-Condition Reinforcement Learning

Stanford Seminar - Robot Learning in the Era of Large Pretrained Models

Stanford Seminar - Robot Learning in the Era of Large Pretrained Models

Robot Learning: Multi-Agent Reinforcement Learning and RLHF

Robot Learning: Multi-Agent Reinforcement Learning and RLHF

Карта робототехники, которую должен увидеть каждый инженер.

Карта робототехники, которую должен увидеть каждый инженер.

ESP32: распознавание речи нейросетью (TensorFlow Lite)

ESP32: распознавание речи нейросетью (TensorFlow Lite)

Robot Learning 2025: Foundational Models for Robotics and Scaling DeepRL

Robot Learning 2025: Foundational Models for Robotics and Scaling DeepRL

Chelsea Finn: Building Robots That Can Do Anything

Chelsea Finn: Building Robots That Can Do Anything

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Откуда в трубке телефона берётся гудок?

Откуда в трубке телефона берётся гудок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Reinforcement Learning For Robots in Python: Isaac Lab Tutorial

Reinforcement Learning For Robots in Python: Isaac Lab Tutorial

Обучение с подкреплением с нуля

Обучение с подкреплением с нуля

Андрей Девятов. Что ждёт Россию после 2025 года?

Андрей Девятов. Что ждёт Россию после 2025 года?

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

Я уменьшился до размеров чипа M5.

Я уменьшился до размеров чипа M5.

Robot Learning: Generalization In Planning

Robot Learning: Generalization In Planning

RobotLearning: Gemini Robotics

RobotLearning: Gemini Robotics

Мессенджер Max: разбираемся без паранойи и даем советы по безопасности

Мессенджер Max: разбираемся без паранойи и даем советы по безопасности

Как финский гик ВЫНЕС Майкрософт и стал богом айти // Линус Торвальдс

Как финский гик ВЫНЕС Майкрософт и стал богом айти // Линус Торвальдс

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]