Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

RETAIN: Robust Robot Policy Finetuning via Parameter Merging

Автор: Foundation Models For Robotics

Загружено: 2025-12-26

Просмотров: 4

Описание:

#Robotics #AI #MachineLearning #VLA #RobotLearning #RETAIN #UCBerkeley

Generalist robot policies are incredible, but they face a major hurdle: **overfitting**. When we finetune these policies on a new task with limited data, they often lose their generalist abilities and fail to handle even simple variations of the new task.

In this video, we dive into *RETAIN* (Robust finE-tuning wiTh pArameter mergINg), a simple yet powerful solution from researchers at UC Berkeley. RETAIN allows a robot to learn a new skill—like wiping a whiteboard or placing plates in a rack—while **retaining its broad pretrained knowledge**.

*What is RETAIN?*
The core idea is surprisingly simple: instead of just using the finetuned model, we *linearly interpolate (merge) the weights* of the pretrained generalist model and the newly finetuned model in weight space. This process combines the task-specific expertise of finetuning with the robust generalization of the base model.

*Key Highlights:*
*Robust Generalization:* RETAIN policies succeed in *out-of-distribution (OOD)* scenarios—such as changes in lighting, backgrounds, or object instances—where standard finetuning fails.
*Preserving Generalist Skills:* Unlike naive approaches, RETAIN ensures the robot doesn't forget its prior abilities.
*Continual Learning:* It enables **sequential skill acquisition**, allowing new tasks to be "merged" into the policy one after another without sacrificing old ones.
*Modality Insights:* Research shows that when merging Vision-Language-Action (VLA) models, the *language model parameters* often matter the most for maintaining robustness.

*Real-World Results:*
Tested on real Franka robot arms (DROID dataset) and in simulation (LIBERO), RETAIN achieved a *40% higher success rate* on average compared to prior finetuning methods in novel scenarios.

Whether you are a researcher, a student, or a tech enthusiast, understanding RETAIN is key to building robots that can truly adapt to the messy, unpredictable real world.

---
*Analogy for Understanding:*
Think of a generalist robot as a *pro athlete**. If you train them exclusively to play only one specific position on a new team (SFT), they might become stiff and forget their overall athleticism. **RETAIN* is like allowing them to practice that new position while keeping their core athletic "muscle memory" intact, so they can still react to any play on the field.

---
*Tags:*
Robotics, AI, RETAIN, Robot Finetuning, Parameter Merging, Vision-Language-Action, VLA, Machine Learning, UC Berkeley, DROID Robot, LIBERO Simulation, Model Merging, Continual Learning, Robotic Manipulation, Overfitting in AI, Generalist Robot Policies, Neural Network Interpolation, AI Research

RETAIN: Robust Robot Policy Finetuning via Parameter Merging

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

LLMs Meet Robotics: What Are Vision-Language-Action Models? (VLA Series Ep.1)

LLMs Meet Robotics: What Are Vision-Language-Action Models? (VLA Series Ep.1)

Gemini 1.5: Раскрытие нового интеллекта с помощью контекстного окна в 1 миллион токенов

Gemini 1.5: Раскрытие нового интеллекта с помощью контекстного окна в 1 миллион токенов

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

ESP32: распознавание речи нейросетью (TensorFlow Lite)

ESP32: распознавание речи нейросетью (TensorFlow Lite)

Chelsea Finn: Building Robots That Can Do Anything

Chelsea Finn: Building Robots That Can Do Anything

Расшифровка роботизированной интуиции: создание систем искусственного интеллекта, которые *знают*...

Расшифровка роботизированной интуиции: создание систем искусственного интеллекта, которые *знают*...

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

Превратите ЛЮБОЙ файл в знания LLM за СЕКУНДЫ

ESP32 + MLX90640: тепловизор с искусственным интеллектом (TensorFlow Lite)

ESP32 + MLX90640: тепловизор с искусственным интеллектом (TensorFlow Lite)

Короткометражка «Апокалипсис ИИ» | Озвучка DeeaFilm

Короткометражка «Апокалипсис ИИ» | Озвучка DeeaFilm

Взорвать море Дирака | Атомный ликбез

Взорвать море Дирака | Атомный ликбез

X-Humanoid: Robotize Human Videos to Generate Humanoid Videos at Scale

X-Humanoid: Robotize Human Videos to Generate Humanoid Videos at Scale

Как Сделать Идеальный Сервопривод из любого BLDC мотора | Векторное управление | Робособака №1

Как Сделать Идеальный Сервопривод из любого BLDC мотора | Векторное управление | Робособака №1

Электростатический синтез был «невозможен»… пока этот крошечный реактор не потряс всех.

Электростатический синтез был «невозможен»… пока этот крошечный реактор не потряс всех.

Китай на грани... И вот что он делает

Китай на грани... И вот что он делает

Абсурдный хак улучшает ИИ, ИИ-Аристотель, ИИ за 6$ круче Claude

Абсурдный хак улучшает ИИ, ИИ-Аристотель, ИИ за 6$ круче Claude

Latent Action Diffusion: Unifying Robot Control Across Diverse Hands and Grippers

Latent Action Diffusion: Unifying Robot Control Across Diverse Hands and Grippers

Танк-блинчик с башней в башне и ниже человека

Танк-блинчик с башней в башне и ниже человека

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

ПОСЛЕ СМЕРТИ ВАС ВСТРЕТЯТ НЕ РОДСТВЕННИКИ, А.. ЖУТКОЕ ПРИЗНАНИЕ БЕХТЕРЕВОЙ. ПРАВДА КОТОРУЮ СКРЫВАЛИ

Китай вскрыл Луну: Что на самом деле нашли на обратной стороне?

Китай вскрыл Луну: Что на самом деле нашли на обратной стороне?

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]