【強化学習】Q学習 - データを用いて最適方策を学習【強化学習の基礎アルゴリズム】RL vol. 14
Автор: AIcia Solid Project
Загружено: 2024-04-05
Просмотров: 9177
ついにあの「Q学習」がやってきた! データから最適方策を学習できる素敵アルゴリズムであり、この子はベルマン最適作用素のデータ近似で学習を進めます。
深層強化学習の革命児 DQN の元ネタでもあるQ学習を抑え、素敵な強化学習ライフを始めましょう!
【プレイリスト】
• 強化学習の探検
【目次】
00:00 オープニング
01:10 Q学習とは
03:53 Q学習の全体像
11:19 TD法の復習
16:56 Q学習のTD誤差
21:37 数式の説明
22:36 ε-greedyについて
29:02 まとめ
32:53 エンディング
【参考文献】
Watkins, Christopher John Cornish Hellaby. "Learning from delayed rewards." (1989).
https://www.cs.rhul.ac.uk/~chrisw/new...
分析モデル入門
https://amzn.to/3Ng0nC7
私の本! この動画シリーズは、この第3部 強化学習 の内容を動画向けにアレンジ、大幅追加、大幅削除したものです。
合わせてみていただくと分かり易いかと!
強化学習(第2版)
https://amzn.to/3K4QsR8
Sutton 先生の「強化学習」本の和訳です。分厚いですが、時間があり、基礎をしっかり学びたい人におすすめ!
ちなみに、英語版は公式で pdf もダウンロードできます → http://incompleteideas.net/book/
強化学習 (機械学習プロフェッショナルシリーズ)
https://amzn.to/44R2XYr
理論家向けの方にはこちら!
しっかりと数式が解説されており、基礎の理論をしっかりと学ぶことができます。
機械学習スタートアップシリーズ Pythonで学ぶ強化学習
https://amzn.to/3XYDrOM
手を動かしながら学びたい人向け!
サンプルコードとともに、基礎的な強化学習アルゴリズムを学べます!
将棋AIで学ぶディープラーニング
https://www.amazon.co.jp/dp/B07B7JJ929
強化学習というと、将棋 AI を思い浮かべる人も少なくないはず!
そういう人におすすめ!
将棋 AI 向けの強化学習は、他の参考文献にある方法とはかなり異なる方法で作られます。
将棋を目指す方は、ぜひこれを見てみてください!
更に強いのを作るならこれ → https://amzn.to/3pU1aDa
強化学習の基礎と深層強化学習
https://www.slideshare.net/ShotaImai3...
合間に広告が貼ることが極めて重い欠点ですが、内容は素晴らしく、全体感を見渡すことができます。
【宣伝:本も買ってね!】
データサイエンスに頻出の分析モデルを、全領域、深く、書きあげました!
本質を捉えたデータ分析のための分析モデル入門 https://amzn.to/3Ng0nC7
【宣伝2:クラファンやってるよ!】
活動継続のためのご支援をお願いしています。詳細はこちら!
クラファン(月額)はこちら → https://community.camp-fire.jp/projec...
(クラファン始めた理由の動画 → • 【クラウドファンディング】始めるよ!【ご支援よろしくお願いします】#167 #VRア... )
【終わりに】
ご視聴ありがとうございました!
面白かったら高評価、チャンネル登録お願いします。
動画の質問、感想などは、コメント欄や Twitter にどうぞ!
お仕事、コラボのご依頼、インターンの応募は、公式 WebPage や Twitter の DM からお願い致します。
AIcia Solid Project - Official Website - https://sites.google.com/view/aicia-o...
動画生成:AIcia Solid (Twitter: / aicia_solid )
動画編集:AIbis Solid (妹)
=======
Logo: ChikakoHorioさん ( / chikakohorio )
Model Design by: ばんちょうさん( / k_ban_ )ママ!
3D Model by: キツネツキさん( / _kitsune_tsuki_ ) パパ!
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: