MLP強化学習

概要

逐次的な意思決定ルールを学習する強化学習が，近年のデータ駆動型アプローチの発展の恩恵を受け，システムに関する知識が少ない状況でも学習目的を達成するようになり注目を集めています．さらに応用分野ではビジネス，金融，医療，ゲームなどの領域で活用が進んでいます．今回はこの強化学習を体系的かつ数理的に理解するため，本勉強会を企画し，ベルマン方程式，TD学習，方策勾配，POMDP，深層強化学習などを扱います．

目的

強化学習全般の知識を身につける．
数理的側面から強化学習アルゴリズムを理解する．

第1章 :準備第3章 :探索と活用のトレードオフ第2章 :プランニング第4章 :モデルフリー型の強化学習第5章 :モデルベース型の強化学習第6章 :関数近似を用いた強化学習第7章 :部分観測のマルコフ決定過程第8章 :最近の話題

実施期間・日時

場所: オンライン (Zoom)
日時: 2020年2月 - 3月, 毎週日曜日15時 - 17時

参考資料

[1] 森村哲郎. 機械学習プロフェッショナルシリーズ強化学習. 講談社, 2019.