書籍『ゼロから作るDeep Learning ❹ 強化学習編』(オライリー・ジャパン)のサポートサイトです。本書籍で使用するソースコードがまとめられています。
本書の内容を確認するための「強化学習100題」を用意しています。
https://koki0702.github.io/dezero-p100/
| フォルダ名 | 説明 |
|---|---|
| ch01 | 1章で使用するソースコード |
| ... | ... |
| ch09 | 9章で使用するソースコード |
| common | 共通で使用するソースコード |
| notebooks | Jupyter Notebook形式のソースコード |
| pytorch | PyTorchに移植したソースコード |
本書のコードはJupyter Notebookでも用意しています。次の表にあるボタンをクリックすることで、Google ColabやKaggle Notebookなどのクラウドサービス上でNotebookを実行することができます。
| 章 | Colab | Kaggle | Studio Lab |
|---|---|---|---|
| 1章 バンディット問題 | |||
| 4章 動的計画法 | |||
| 5章 モンテカルロ法 | |||
| 6章 TD法 | |||
| 7章 ニューラルネットワークとQ学習 | |||
| 8章 DQN | |||
| 9章 方策勾配法 |
ソースコードを実行するには、下記のソフトウェアが必要です。
- Python 3.x(バージョン3系)
- NumPy
- Matplotlib
- OpenAI Gym
- DeZero (または PyTorch)
本書では、ディープラーニングのフレームワークとしてDeZeroを使います。DeZeroは「ゼロから作るDeep Learning」シリーズの3作目で作ったフレームワークです( pip install dezero からインストールできます)。
PyTorchを使った実装はpytorchフォルダにて提供しています。
各章のフォルダに該当するコードがあります。 実行するためには、下記のとおりPythonコマンドを実行します(どのディレクトリからでも実行できます)。
$ python ch01/avg.py
$ python ch08/dqn.py
$ cd ch09
$ python actor_critic.py
本リポジトリのソースコードはMITライセンスです。 商用・非商用問わず、自由にご利用ください。
本書の正誤情報は以下のページで公開しています。
https://github.com/oreilly-japan/deep-learning-from-scratch-4/wiki/errata
本ページに掲載されていない誤植など間違いを見つけた方は、[email protected]までお知らせください。

