Train Your First RL Agent from Scratch (Python): Q-Learning

Автор: edreate

Загружено: 2026-01-01

Просмотров: 131

Описание:

Q-Learning algorithm implementation in python from scratch along with environment implementation.

Code: https://github.com/edreate/Reinforcem...
Complete lesson with detailed writeup: https://www.edreate.com/courses/deep-...
Q-Learning Algorithm Explanation: https://edreate.com/courses/deep-rein...

Full Course: https://www.edreate.com/courses/deep-...

Join our Discord Server if you have any questions: / discord

00:00 - Introduction
00:30 - Brief Introduction to Q-Learning
02:00 - Python Implementation (Environment, Agent and Training)
10:05 - Policy Extraction
10:53 - Conclusion and Future Steps
11:45 - Outro

#ReinforcementLearningCourse #ReinforcementLearningTutorial #QLearning #Python #edreate

Train Your First RL Agent from Scratch (Python): Q-Learning

Доступные форматы для скачивания:

Скачать видео mp4

Информация по загрузке:

Скачать аудио mp3

Похожие видео

Reinforcement Learning Trading Bot in Python | Train an AI Agent on Forex (EURUSD)

Reinforcement Learning Trading Bot in Python | Train an AI Agent on Forex (EURUSD)

Exact Solution Methods: Value Iteration | Reinforcement Learning Explained | edreate.com

Exact Solution Methods: Value Iteration | Reinforcement Learning Explained | edreate.com

I Built a Trading Strategy That Finds Its Own Best Settings

I Built a Trading Strategy That Finds Its Own Best Settings

The FASTEST introduction to Reinforcement Learning on the internet

The FASTEST introduction to Reinforcement Learning on the internet

Q-Learning Explained: From Intuition to Python Implementation

Q-Learning Explained: From Intuition to Python Implementation

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Синьор 1С: 10 привычек, без которых ты не вырастешь

Синьор 1С: 10 привычек, без которых ты не вырастешь

Как устроена компьютерная графика? OpenGL / C++

Как устроена компьютерная графика? OpenGL / C++

Код работает в 100 раз медленнее из-за ложного разделения ресурсов.

Код работает в 100 раз медленнее из-за ложного разделения ресурсов.

Q-Learning Tutorial in Python - Reinforcement Learning

Q-Learning Tutorial in Python - Reinforcement Learning

Создание нейронной сети С НУЛЯ (без Tensorflow/Pytorch, только NumPy и математика)

Создание нейронной сети С НУЛЯ (без Tensorflow/Pytorch, только NumPy и математика)

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Как происходит модернизация остаточных соединений [mHC]

Как происходит модернизация остаточных соединений [mHC]

Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 1: Class Intro

Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 1: Class Intro

Декораторы Python — наглядное объяснение

Декораторы Python — наглядное объяснение

Почему ваш код не соответствует Python (и как это исправить)

Почему ваш код не соответствует Python (и как это исправить)

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Румынская математическая олимпиада

Румынская математическая олимпиада

Simply Explaining Deep Q-Learning/Deep Q-Network (DQN) | Python Pytorch Deep Reinforcement Learning

Simply Explaining Deep Q-Learning/Deep Q-Network (DQN) | Python Pytorch Deep Reinforcement Learning