Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

Train Your First RL Agent from Scratch (Python): Q-Learning

Автор: edreate

Загружено: 2026-01-01

Просмотров: 131

Описание:

Q-Learning algorithm implementation in python from scratch along with environment implementation.

Code: https://github.com/edreate/Reinforcem...
Complete lesson with detailed writeup: https://www.edreate.com/courses/deep-...
Q-Learning Algorithm Explanation: https://edreate.com/courses/deep-rein...

Full Course: https://www.edreate.com/courses/deep-...

Join our Discord Server if you have any questions:   / discord  

00:00 - Introduction
00:30 - Brief Introduction to Q-Learning
02:00 - Python Implementation (Environment, Agent and Training)
10:05 - Policy Extraction
10:53 - Conclusion and Future Steps
11:45 - Outro

#ReinforcementLearningCourse #ReinforcementLearningTutorial #QLearning #Python #edreate

Train Your First RL Agent from Scratch (Python): Q-Learning

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

Reinforcement Learning Trading Bot in Python | Train an AI Agent on Forex (EURUSD)

Reinforcement Learning Trading Bot in Python | Train an AI Agent on Forex (EURUSD)

Exact Solution Methods: Value Iteration | Reinforcement Learning Explained | edreate.com

Exact Solution Methods: Value Iteration | Reinforcement Learning Explained | edreate.com

I Built a Trading Strategy That Finds Its Own Best Settings

I Built a Trading Strategy That Finds Its Own Best Settings

The FASTEST introduction to Reinforcement Learning on the internet

The FASTEST introduction to Reinforcement Learning on the internet

Q-Learning Explained: From Intuition to Python Implementation

Q-Learning Explained: From Intuition to Python Implementation

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!

Синьор 1С: 10 привычек, без которых ты не вырастешь

Синьор 1С: 10 привычек, без которых ты не вырастешь

Как устроена компьютерная графика? OpenGL / C++

Как устроена компьютерная графика? OpenGL / C++

Код работает в 100 раз медленнее из-за ложного разделения ресурсов.

Код работает в 100 раз медленнее из-за ложного разделения ресурсов.

Q-Learning Tutorial in Python - Reinforcement Learning

Q-Learning Tutorial in Python - Reinforcement Learning

Создание нейронной сети С НУЛЯ (без Tensorflow/Pytorch, только NumPy и математика)

Создание нейронной сети С НУЛЯ (без Tensorflow/Pytorch, только NumPy и математика)

Самая сложная модель из тех, что мы реально понимаем

Самая сложная модель из тех, что мы реально понимаем

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?

Как происходит модернизация остаточных соединений [mHC]

Как происходит модернизация остаточных соединений [mHC]

Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 1: Class Intro

Stanford CS224R Deep Reinforcement Learning | Spring 2025 | Lecture 1: Class Intro

Декораторы Python — наглядное объяснение

Декораторы Python — наглядное объяснение

Почему ваш код не соответствует Python (и как это исправить)

Почему ваш код не соответствует Python (и как это исправить)

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Как внимание стало настолько эффективным [GQA/MLA/DSA]

Румынская математическая олимпиада

Румынская математическая олимпиада

Simply Explaining Deep Q-Learning/Deep Q-Network (DQN) | Python Pytorch Deep Reinforcement Learning

Simply Explaining Deep Q-Learning/Deep Q-Network (DQN) | Python Pytorch Deep Reinforcement Learning

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com