(深層)強化学習の解説とデモ
Автор: サプライ・チェイン最適化チャンネル(MIKIO KUBO)
Загружено: 2021-12-03
Просмотров: 5401
(深層)強化学習についてデモを交えて解説しています.デモに使用したPythonコードは「100+の最適化問題」の最短路のページ https://scmopt.github.io/opt100/03sp.... にあります.
動画プレイリスト:
Pythonで数理最適化モデルを作る方法 • Pythonで数理最適化
組合せ最適化とアルゴリズム • 組合せ最適化とアルゴリズム
Python言語による実務で役に立つ100の最適化問題 • Python言語による実務で役に立つ100の最適化問題
ただでアナリティクスの専門家になる方法 • タダでアナリティクスの専門家になる方法
データサイエンス練習問題集 • データサイエンス練習問題集
データサイエンス講義
• Pythonによるデータサイエンス講義
Python言語超入門 • Python言語超入門
メタヒューリスティクス • メタヒューリスティクス
SCMOPT サプライ・チェイン最適化プロジェクト • SCMOPT
MITの深層学習講義を日本語で解説 • MIT Intro to DL
サプライ・チェイン最適化講義 • サプライ・チェイン最適化講義
サプライ・チェイン最適化特論 • サプライ・チェイン最適化特論
制約最適化ソルバー SCOP • 制約最適化ソルバーSCOPの使用法
スケジューリング最適化ソルバーOptSeq • スケジューリング最適化ソルバーOptSeqの使用法
Table of Contents:
00:05 - 強化学習とは
01:28 - 例:格子世界のロボット
03:30 - マルコフ決定過程 (MDP)
05:32 - 方策
07:05 - 価値関数
08:22 - 最適価値関数
10:54 - 動的計画法
12:06 - 方策評価と方策改善
14:10 - 方策反復/価値反復
15:02 - モンテカルロ(MC)方策評価
16:45 - モンテカルロ (MC) コントロール
17:28 - 探索(exploration)
18:26 - モンテカルロ法の利点
20:14 - Temporal Difference (TD)学習
22:27 - モンテカルロ vs. TD
23:53 - Sarsa
24:52 - デモ (エピソード1)ソースコードは「100+の最適化問題」https://mikiokubo.github.io/opt100/の最...
26:09 - デモ (エピソード2)
26:50 - デモ (エピソード5000経過)
27:14 - 深層強化学習
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: