[12] Seleção de Ações com Upper Confidence Bound (UCB)

Reinforcement Learning

Aprendizado por Reforço

Sutton and Barto

Sutton & Barto

RL em Python

Inteligência Artificial

Machine Learning

Deep Learning

Multi-Armed Bandit

Markov

Bellman

Programação Dinâmica

Monte Carlo

PPO

Автор: Monte Carlo Digital

Загружено: 21 апр. 2025 г.

Просмотров: 13 просмотров

Описание:

Aprendizado por Reforço — Do Básico ao Avançado

Esta playlist é uma jornada completa pelo universo do Reinforcement Learning (RL), seguindo o livro "Reinforcement Learning: An Introduction" de Sutton & Barto. Começamos pelos fundamentos com problemas de Multi-Armed Bandits e avançamos por tópicos essenciais como Processos de Decisão de Markov, Equações de Bellman, Programação Dinâmica, Monte Carlo, TD Learning, Policy Gradient e até PPO (Proximal Policy Optimization).

Cada vídeo combina teoria acessível, exemplos visuais e implementações práticas, ideal para quem quer dominar RL na prática — seja estudante, pesquisador ou profissional da área de IA.

📌 Acompanhe os vídeos na ordem e construa sua base em RL!
📬 Conecte-se com o professor Raphael Garcia Moreira no LinkedIn:
👉 / raphaelgarciamoreira

[12] Seleção de Ações com Upper Confidence Bound (UCB)

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

[10] Como Rastrear Ambientes Não Estacionários

[10] Como Rastrear Ambientes Não Estacionários

[13] UCB na Prática: Implementação com Código

[13] UCB na Prática: Implementação com Código

[8] Cálculo Incremental de Valores-Q

[8] Cálculo Incremental de Valores-Q

[15] Processos Estocásticos: Sequência Temporal e Distribuição Probabilística

[15] Processos Estocásticos: Sequência Temporal e Distribuição Probabilística

Почему "вероятность 0" не означает "невозможно"

Что происходит с нейросетью во время обучения?

Что происходит с нейросетью во время обучения?

24 часа в городе без законов: и воздуха: жизнь на высоте при 50% кислорода

24 часа в городе без законов: и воздуха: жизнь на высоте при 50% кислорода

سورة يسٓ كاملة للشيخ ياسر الدوسري من ليالي رمضان عام 1442 هـ Surah Yaseen

سورة يسٓ كاملة للشيخ ياسر الدوسري من ليالي رمضان عام 1442 هـ Surah Yaseen

Заработай $10,000 Студентом: СДЕЛАЙ ЭТО!

Заработай $10,000 Студентом: СДЕЛАЙ ЭТО!

[4] Treinando a Rede Neural no Google Colab em Python

[4] Treinando a Rede Neural no Google Colab em Python