Augmented Random Search Tutorial - How to Train Robots to Walk!

Автор: Skowster the Geek

Загружено: 2018-10-08

Просмотров: 6141

Описание:

Learn one of the most advanced reinforcement learning algorithms to emerge in 2018, which has advanced the field of robotics by leaps and bounds, Augmented Random Search. Follow along with the coding tutorial and teach your own robot how to walk in less than an hour!

Correction: at [5:00] normalized = (inputs - observation_mean) / observation_sigma

Code for this tutorial:
https://github.com/colinskow/move37/t...

Original paper:
https://arxiv.org/abs/1803.07055

Dot product tutorial:
https://www.mathsisfun.com/algebra/ma...

Standard deviation and variance tutorial:
https://www.mathsisfun.com/data/stand...

Augmented Random Search Tutorial - How to Train Robots to Walk!

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Deep Q Learning Pong Tutorial

Deep Q Learning Pong Tutorial

Monte Carlo Reinforcement Learning Tutorial

Monte Carlo Reinforcement Learning Tutorial

Q Learning Tutorial for Ride Sharing (Open AI Taxi)

Q Learning Tutorial for Ride Sharing (Open AI Taxi)

Моделирование Монте-Карло

Моделирование Монте-Карло

Как работают неевклидовы игры? | Побитовое

Как работают неевклидовы игры? | Побитовое

Цепи Маркова — математика предсказаний [Veritasium]

Цепи Маркова — математика предсказаний [Veritasium]

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Как Сделать Настольный ЭЛЕКТРОЭРОЗИОННЫЙ Станок?

Невероятное Изобретение - Этот Дрон Изменит Все

Невероятное Изобретение - Этот Дрон Изменит Все

Что такое "Reverse Engineering". Показываю как ломают софт.

Bellman Equation Basics for Reinforcement Learning

Bellman Equation Basics for Reinforcement Learning

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Почему нейросети постоянно врут? (и почему этого уже не исправить)

Почему нейросети постоянно врут? (и почему этого уже не исправить)

КАК ХИКАРУ обыграл СИЛЬНЕЙШУЮ ПРОГРАММУ? ЧЕЛОВЕК ПРОТИВ ИИ

КАК ХИКАРУ обыграл СИЛЬНЕЙШУЮ ПРОГРАММУ? ЧЕЛОВЕК ПРОТИВ ИИ

Я построил нейронную сеть с нуля

Я построил нейронную сеть с нуля

Обучение с подкреплением, по книге

Обучение с подкреплением, по книге

🧪🧪🧪🧪Как увидеть гиперпространство (4-е измерение)

🧪🧪🧪🧪Как увидеть гиперпространство (4-е измерение)

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Теренс Тао о том, как Григорий Перельман решил гипотезу Пуанкаре | Лекс Фридман

Введение в методы градиента политики — глубокое обучение с подкреплением

Введение в методы градиента политики — глубокое обучение с подкреплением

Policy Gradient Methods Tutorial

Policy Gradient Methods Tutorial

Градиенты политики легко реализуются в Keras | Учебное пособие по глубокому обучению с подкреплением

Градиенты политики легко реализуются в Keras | Учебное пособие по глубокому обучению с подкреплением