FIDLE / Tactiques et stratégies du Deep Reinforcement Learning

Автор: CNRS - Formation FIDLE

Загружено: 2024-04-04

Просмотров: 5554

Описание:

Après le supervisé et le non supervisé, la révolution du Deep Learning s’est également étendue à “l’apprentissage par renforcement”, occasionnant une accélération du développement de la robotique.

Ce développement s'est notamment illustré avec des victoires face aux meilleurs joueurs humains (AlphaGo), la capacité à élaborer des stratégies ou des tactiques, ou encore dernièrement, en contribuant au succès de ChatGPT (grâce au RLHF).

Le sujet est très vaste et cette séquence mériterait de très nombreuses heures, compte tenue de la complexité et de la richesse du domaine :-)

Durant cette séquence, nous essayerons de retracer, rapidement et ensemble, le chemin parcouru au XXe et XXIe siècle, et de comprendre les enjeux et les différentes techniques derrière ces IA qui ont (elles aussi) changées la donne !

Au menu de cette séquence :
Introduction au Reinforcement Learning
Q-learning vs Sarsa
Du RL au DQN,
Policy Gradient, pour être directement dans l’action
Cas d’usage, résultats et perspectives

Durée : 2h30

Pour rappel, FIDLE est une Formation d'Introduction au Deep Learning, libre et gratuite.
Pour en savoir plus : https://fidle.cnrs.fr

Cette vidéo est sous licence Créative Common CC BY-NC-ND 4.0

FIDLE / Tactiques et stratégies du Deep Reinforcement Learning

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

FIDLE / Des neurones pour la physique, les physics-informed neural networks (PINNS)

FIDLE / Des neurones pour la physique, les physics-informed neural networks (PINNS)

Quelles sont les limites de l'IA ? - Formation Découverte de l'IA

Quelles sont les limites de l'IA ? - Formation Découverte de l'IA

Représentation du réel : Data, embedding et espace latent (épisode 9)

Représentation du réel : Data, embedding et espace latent (épisode 9)

FIDLE / Travailler avec des données structurées : Graph Neural Network (GNN)

FIDLE / Travailler avec des données structurées : Graph Neural Network (GNN)

FIDLE / Generative Adversarial Networks (GAN)

FIDLE / Generative Adversarial Networks (GAN)

Эпштейн, друзья и дети: кто был связан с монстром? | Трамп, Клинтон, Майкл Джексон, Билл Гейтс

Эпштейн, друзья и дети: кто был связан с монстром? | Трамп, Клинтон, Майкл Джексон, Билл Гейтс

Катастрофа, которая нас (возможно) ждёт [Veritasium]

Катастрофа, которая нас (возможно) ждёт [Veritasium]

Q-Learning: Model Free Reinforcement Learning and Temporal Difference Learning

Q-Learning: Model Free Reinforcement Learning and Temporal Difference Learning

FIDLE / Mathématiques & gradients everywhere !!!

FIDLE / Mathématiques & gradients everywhere !!!

FIDLE / Diffusion model, text to image

FIDLE / Diffusion model, text to image

MIT 6.S191: Reinforcement Learning

MIT 6.S191: Reinforcement Learning

⚡️АСЛАНЯН: ЭТО ВИДЕО РВЁТ интернет! Путина СПАЛИЛИ на камеру. СРОЧНЫЙ УКАЗ по

⚡️АСЛАНЯН: ЭТО ВИДЕО РВЁТ интернет! Путина СПАЛИЛИ на камеру. СРОЧНЫЙ УКАЗ по "СВО". Теперь всё ясно

Deep Reinforcement Learning: Neural Networks for Learning Control Laws

Deep Reinforcement Learning: Neural Networks for Learning Control Laws

A friendly introduction to deep reinforcement learning, Q-networks and policy gradients

A friendly introduction to deep reinforcement learning, Q-networks and policy gradients

Русский след и Майкл Джексон. Чем примечателен новый компромат на Трампа

Русский след и Майкл Джексон. Чем примечателен новый компромат на Трампа

Qu'est-ce que l'intelligence artificielle (IA) ? - Formation Parcours Découverte

Qu'est-ce que l'intelligence artificielle (IA) ? - Formation Parcours Découverte

Apprentissage par renforcement #5 : Introduction au Q-Learning

Apprentissage par renforcement #5 : Introduction au Q-Learning

FORMATION DEEP LEARNING COMPLETE (2021)

FORMATION DEEP LEARNING COMPLETE (2021)

Méthodologie et optimisation de l'apprentissage (épisode 11)

Méthodologie et optimisation de l'apprentissage (épisode 11)

Reinforcement Learning Series: Overview of Methods

Reinforcement Learning Series: Overview of Methods