[12] Seleção de Ações com Upper Confidence Bound (UCB)
Автор: Monte Carlo Digital
Загружено: 21 апр. 2025 г.
Просмотров: 13 просмотров
Aprendizado por Reforço — Do Básico ao Avançado
Esta playlist é uma jornada completa pelo universo do Reinforcement Learning (RL), seguindo o livro "Reinforcement Learning: An Introduction" de Sutton & Barto. Começamos pelos fundamentos com problemas de Multi-Armed Bandits e avançamos por tópicos essenciais como Processos de Decisão de Markov, Equações de Bellman, Programação Dinâmica, Monte Carlo, TD Learning, Policy Gradient e até PPO (Proximal Policy Optimization).
Cada vídeo combina teoria acessível, exemplos visuais e implementações práticas, ideal para quem quer dominar RL na prática — seja estudante, pesquisador ou profissional da área de IA.
📌 Acompanhe os vídeos na ordem e construa sua base em RL!
📬 Conecte-se com o professor Raphael Garcia Moreira no LinkedIn:
👉 / raphaelgarciamoreira
![[12] Seleção de Ações com Upper Confidence Bound (UCB)](https://ricktube.ru/thumbnail/XAtYMvMhOGg/hq720.jpg)
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: