Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

【強化学習】DQN - 深層強化学習時代の到来を告げる超すごいモデル!【Atari 攻略①】RL vol. 28

Автор: AIcia Solid Project

Загружено: 2025-08-22

Просмотров: 3592

Описание:

DQN (Deep Q-Network) は、深層強化学習時代の始まりを告げる2013年のモデルです。
2012年の AlexNet 以降、現代の AI ブームが始まりまして、今の ChatGPT などに繋がります。

Q学習忘れた方はこちら見てね →    • 【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】R...  

深層学習を学びたい方はこちら!
プレイリスト →    • Deep Learning の世界  
畳み込み層 →    • 【深層学習】畳み込み層の本当の意味、あなたは説明できますか?【ディープラーニングの世...  
AlexNet ↑    • 【深層学習】CNN紹介 "AlexNet" 2012年に登場し、画像処理に革命を起こ...  

【プレイリスト】
   • 強化学習の探検  

【目次】
00:00 オープニング
01:28 DQNはすごい!
11:25 DQNの学習
25:28 詳細
38:12 DQNの先へ
42:08 エンディング

【参考文献】
分析モデル入門
https://amzn.to/3Ng0nC7
私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。
合わせてみていただくと分かり易いかと!

強化学習(第2版)
https://amzn.to/3K4QsR8
Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ!
ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/

強化学習 (機械学習プロフェッショナルシリーズ)
https://amzn.to/44R2XYr
理論家向けの方にはこちら!
しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。

機械学習スタートアップシリーズ Pythonで学ぶ強化学習
https://amzn.to/3XYDrOM
手を動かしながら学びたい人向け!
サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます!

将棋AIで学ぶディープラーニング
https://www.amazon.co.jp/dp/B07B7JJ929
強化学習というと、将棋 AI を思い浮かべる人も少なくないはず!
そういう人におすすめ!
将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。
将棋を目指す方は、ぜひこれを見てみてください!
更に強いのを作るならこれ → https://amzn.to/3pU1aDa

強化学習の基礎と深層強化学習
https://www.slideshare.net/ShotaImai3...
合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。


【宣伝:本も買ってね!】
データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました!
本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7

データ分析に必要な数学を、基礎から最先端まで、過不足なく、数式の気持ちも含めて解説しました!
妥協しないデータ分析のための 微積分+線形代数入門
https://amzn.to/3B4y8G4

【宣伝2:クラファンやってるよ!】
活動継続のためのご支援をお願いしています。詳細はこちら!
クラファン(月額)はこちら → https://community.camp-fire.jp/projec...
(クラファン始めた理由の動画 →    • 【クラウドファンディング】始めるよ!【ご支援よろしくお願いします】#167 #VRア...   )

【終わりに】
ご視聴ありがとうございました!
面白かったら高評価、チャンネル登録お願いします。
動画の質問、感想などは、コメント欄や Twitter にどうぞ!
お仕事、コラボのご依頼、インターンの応募は、公式 WebPage や Twitter の DM からお願い致します。

AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-o...
動画生成:AIcia Solid (Twitter:   / aicia_solid   )
動画編集:AIbis Solid (妹)

=======

Logo: ChikakoHorioさん (   / chikakohorio   )
Model Design by: ばんちょうさん(   / k_ban_   )ママ!
3D Model by: キツネツキさん(   / _kitsune_tsuki_   ) パパ!

【強化学習】DQN - 深層強化学習時代の到来を告げる超すごいモデル!【Atari 攻略①】RL vol. 28

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

ЭТО 100% ХИТ 2026 ГОДА для FPV ДРОНА!

ЭТО 100% ХИТ 2026 ГОДА для FPV ДРОНА!

【LIVE】祝7周年! - 来年は飛躍の年にしたい。振り返りと抱負!【来年も生きるぞ~】 #VRアカデミア

【LIVE】祝7周年! - 来年は飛躍の年にしたい。振り返りと抱負!【来年も生きるぞ~】 #VRアカデミア

【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】RL vol. 14 #176 #VRアカデミア #ReinforcementLearning

【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】RL vol. 14 #176 #VRアカデミア #ReinforcementLearning

Предел развития НЕЙРОСЕТЕЙ

Предел развития НЕЙРОСЕТЕЙ

🤷 AI обучен на говнокоде! Разработчиков компиляторов, протоколов и СУБД не хватает, а LLM не может

🤷 AI обучен на говнокоде! Разработчиков компиляторов, протоколов и СУБД не хватает, а LLM не может

БЕЛЫЕ СПИСКИ: какой VPN-протокол справится? Сравниваю все

БЕЛЫЕ СПИСКИ: какой VPN-протокол справится? Сравниваю все

Программируем с ИИ в VS Code - БЕСПЛАТНО! Сможет каждый!

Программируем с ИИ в VS Code - БЕСПЛАТНО! Сможет каждый!

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

【強化学習】深層強化学習入門 - 全体像を見ていこう!【いざ深層強化学習】RL vol. 22 #193 #VRアカデミア #ReinforcementLearning

【強化学習】深層強化学習入門 - 全体像を見ていこう!【いざ深層強化学習】RL vol. 22 #193 #VRアカデミア #ReinforcementLearning

【強化学習】REINFORCE - 【方策勾配法④】RL vol. 25 #200 #VRアカデミア #ReinforcementLearning

【強化学習】REINFORCE - 【方策勾配法④】RL vol. 25 #200 #VRアカデミア #ReinforcementLearning

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Новый NotebookLM: НИКОГДА НЕ ВРЕТ! Большой бесплатный курс по нейросети от Google

Новый NotebookLM: НИКОГДА НЕ ВРЕТ! Большой бесплатный курс по нейросети от Google

Deep Q-Learning/Deep Q-Network (DQN) Explained | Python Pytorch Deep Reinforcement Learning

Deep Q-Learning/Deep Q-Network (DQN) Explained | Python Pytorch Deep Reinforcement Learning

強化学習の探検

強化学習の探検

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Глубокое Q-обучение (DQN): революция в обучении с подкреплением | L-07

Глубокое Q-обучение (DQN): революция в обучении с подкреплением | L-07

ESP32: распознавание речи нейросетью (TensorFlow Lite)

ESP32: распознавание речи нейросетью (TensorFlow Lite)

Ваш браузер знает о вас все и сливает данные: как защититься?

Ваш браузер знает о вас все и сливает данные: как защититься?

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

Claude Code: полный гайд по AI-кодингу (хаки, техники и секреты)

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]