定價:NT$ 1200
二手價:71 折,NT$ 850
運送方式:超商取貨、宅配取貨
銷售地區:全球
限量商品,即時庫存=1
內容簡介:針對強化學習的關鍵概念和演算法,提供清晰而簡單的說明
什麼是強化學習
強化學習是學習該做什麼(如何將當前情形映射到動作上),以便最大化一個獎勵訊號數值。學習者不會被告知要採取哪些動作,而是必須透過嘗試來發現哪些動作會產生最大的回報。在最有趣和最具挑戰性的案例中,動作不僅會影響當下的獎勵,同時也會影響下一個情境,並且影響後續所有的獎勵。試誤搜尋和延遲獎勵這兩個特性,是強化學習中的兩個最重要的區別特徵。
本書精采內容包括:
.涵蓋所有強化學習演算法的核心概念
.解決有限馬可夫決策問題的三種基本方法
.近似最佳策略進行控制的方式
.介紹並分析資格痕跡演算法的機制
.強化學習與心理學和神經科學之間的關係
.強化學習的相關應用與未來強化學習研究中一些正在進行的前瞻技術
專家推薦
"這本書是強化學習的聖經,鑑於該領域的蓬勃發展,新版特別及時。不管是學生、研究人員、從業人是,只要對強化學習感興趣的人,都應該收藏一本。"
-Pedro Domingos, 華盛頓大學教授、《大演算》作者
"所有研究強化學習的學者,都曾受到本書第一版的啟發,第二版保證讓大家更滿意。新版的內容大幅增加,新版涵蓋的內容更深更廣,而且依然保留解說簡單直接的特色。"
-Csaba Szepesvari, 阿爾伯塔大學教授、DeepMind研究科學家
"我推薦這本書給所有想要認識機器學習的人。第二版涵蓋了當今最關鍵的演算法與理論,以實際的應用來解說概念,範圍從控制機器人到如何打敗世界頂尖的棋手,並從心理學與神經科學的角度探討演算法與人類學習之間的基本關連。"
-Tom Mitchell, 卡內基梅隆大學教授
"強化學習領域的經典之作,強化學習是現代人工智慧的發展基礎。這是一本想要認真研究AI科技的人必讀的書。"
- Demis Hassabis, DeepMind聯合創始人兼CEO
"第二版的問世恰逢其時,如果您想了解強化學習這個領域,本書是最好的起點。我肯定會將這本書推薦給我的學生以及其他想要了解強化學習的研究人員"
-- Yoshua Bengio, 《深度學習》作者、蒙特婁大學教授
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則、二手CD、DVD退換貨說明。作者:Richard S. Sutton、Andrew G. Barto
二手價:71 折,NT$ 850 NT$ 1200
運送方式:超商取貨、宅配取貨
銷售地區:全球
限量商品,即時庫存=1
內容簡介:針對強化學習的關鍵概念和演算法,提供清晰而簡單的說明
什麼是強化學習
強化學習是學習該做什麼(如何將當前情形映射到動作上),以便最大化一個獎勵訊號數值。學習者不會被告知要採取哪些動作,而是必須透過嘗試來發現哪些動作會產生最大的回報。在最有趣和最具挑戰性的案例中,動作不僅會影響當下的獎勵,同時也會影響下一個情境,並且影響後續所有的獎勵。試誤搜尋和延遲獎勵這兩個特性,是強化學習中的兩個最重要的區別特徵。
本書精采內容包括:
.涵蓋所有強化學習演算法的核心概念
.解決有限馬可夫決策問題的三種基本方法
.近似最佳策略進行控制的方式
.介紹並分析資格痕跡演算法的機制
.強化學習與心理學和神經科學之間的關係
.強化學習的相關應用與未來強化學習研究中一些正在進行的前瞻技術
專家推薦
"這本書是強化學習的聖經,鑑於該領域的蓬勃發展,新版特別及時。不管是學生、研究人員、從業人是,只要對強化學習感興趣的人,都應該收藏一本。"
-Pedro Domingos, 華盛頓大學教授、《大演算》作者
"所有研究強化學習的學者,都曾受到本書第一版的啟發,第二版保證讓大家更滿意。新版的內容大幅增加,新版涵蓋的內容更深更廣,而且依然保留解說簡單直接的特色。"
-Csaba Szepesvari, 阿爾伯塔大學教授、DeepMind研究科學家
"我推薦這本書給所有想要認識機器學習的人。第二版涵蓋了當今最關鍵的演算法與理論,以實際的應用來解說概念,範圍從控制機器人到如何打敗世界頂尖的棋手,並從心理學與神經科學的角度探討演算法與人類學習之間的基本關連。"
-Tom Mitchell, 卡內基梅隆大學教授
"強化學習領域的經典之作,強化學習是現代人工智慧的發展基礎。這是一本想要認真研究AI科技的人必讀的書。"
- Demis Hassabis, DeepMind聯合創始人兼CEO
"第二版的問世恰逢其時,如果您想了解強化學習這個領域,本書是最好的起點。我肯定會將這本書推薦給我的學生以及其他想要了解強化學習的研究人員"
-- Yoshua Bengio, 《深度學習》作者、蒙特婁大學教授
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則、二手CD、DVD退換貨說明。※ 二手徵求後,有綁定line通知的讀者,
該二手書結帳減5元。(減5元可累加)
請在手機上開啟Line應用程式,點選搜尋欄位旁的掃描圖示
即可掃描此ORcode
|
||||||||||||||||||
|
||||||||||||||||||
|