內容簡介:以step by step的方式學習人工智慧的程式撰寫
最近,「人工智慧」、「深度學習」這類的關鍵字出現在的機會非常多,但能夠實際動手做的人卻非常少。本書以非研究者的一般讀者為主要族群,希望帶著各位讀者邊做邊了解強化
學習與深度強化學習,也會盡量介紹與解說可實際操作的程式碼。只要您具備粗淺的程式設計經驗以及初階的線性代數知識,就能看懂本書的內容。
透過本書,您將可以:
.認識強化學習的概念與術語
.學到策略梯度法、Sarsa、Q學習演算法的撰寫方式
.了解Anaconda的設定方法
.利用PyTorch撰寫深度學習的程式碼,解決分類手寫數字影像的MNIST課題
.了解DQN演算法的撰寫方法
.利用深度學習演算法撰寫倒立單擺系統
.利用深度強化學習的A2C撰寫打磚塊遊戲
.利用AWS的GPU建置深度學習環境的方法
目錄
章節說明:第1章 強化學習的概要
1.1 機械學習的分類(監督式學習、非監督式學習、強化學習)
1.2 強化學習、深度強化學習的歷史
1.3 深度強化學習的應用實例
第2章 以強化學習建置迷宮課題
2.1 Try Jupter的使用方法
2.2 建置迷宮與智能體
2.3 建置策略迭代法
2.4 整理價值迭代法的專業術語
2.5 建置Sarsa
2.6 建置Q學習
第3章 利用倒立單擺課題學習強化學習
3.1 於本地端電腦建置強化學習執行環境的方法
3.2 解說倒立單擺課題「CartPole」
3.3 說明多變數、連續值狀態的表格表示法
3.4 撰寫Q學習
第4章 利用PyTorch建置深度學習
4.1 神經網路與深度學習的歷史
4.2 解說深度學習的計算方式
4.3 利用PyTorch撰寫分類手寫數字影像的MNIST課題
第5章 建置深度強化學習DQN
5.1 深度強化學習DQN(Deep Q-Network)的解說
5.2 建置DQN的四項重點
5.3 建置DQN(上篇)
5.4 建置DQN(下篇)
第6章 建置深度強化學習的進階版
6.1 深度強化學習的演算法地圖
6.2 建置DDQN(Double-DQN)
6.3 建置Dueling Network
6.4 建置Prioritized Experience Replay
6.5 建置A2C
第7章 於AWS的GPU環境建置打磚塊遊戲
7.1 解說打磚塊遊戲「Breakout」
7.2 於AWS建置使用GPU的深度學習的執行環境
7.3 學習Breakout之際的四項重要事項
7.4 A2C的建置(上篇)
7.5 A2C的建置(下篇)
章節說明:第1章 強化學習的概要
1.1 機械學習的分類(監督式學習、非監督式學習、強化學習)
1.2 強化學習、深度強化學習的歷史
1.3 深度強化學習的應用實例
第2章 以強化學習建置迷宮課題
2.1 Try Jupter的使用方法
2.2 建置迷宮與智能體
2.3 建置策略迭代法
2.4 整理價值迭代法的專業術語
2.5 建置Sarsa
2.6 建置Q學習
第3章 利用倒立單擺課題學習強化學習
3.1 於本地端電腦建置強化學習執行環境的方法
3.2 解說倒立單擺課題「CartPole」
3.3 說明多變數、連續值狀態的表格表示法
3.4 撰寫Q學習
第4章 利用PyTorch建...