內容簡介
本書對增強學習與近似動態規劃的理論、演算法及應用進行了深入研究
和論述。主要內容包括:求解Markov鏈學習預測問題的時域差值學習算
法和理論,求解連續空間Markov決策問題的梯度增強學習演算法以及進化一
梯度混合增強學習演算法,基於核的近似動態規劃演算法,增強學習在移動機器
人導航與控制中的應用等。本書是作者在多個國家自然科學基金專案資助
下取得的研究成果的總結,意在推動增強學習與近似動態規劃理論與應用
的發展,對於智慧科學的前沿研究和智慧學習系統的應用具有重要的科學
意義。
本書可作為高等院校與科研院所中從事人工智慧與智慧資訊處理、機
器人與智慧控制、智慧決策支援系統等專業領域的研究和教學用書,也可作
為自動化、電腦與管理學領域其他相關專業師生及科研人員的參考書。
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。內容簡介
本書對增強學習與近似動態規劃的理論、演算法及應用進行了深入研究
和論述。主要內容包括:求解Markov鏈學習預測問題的時域差值學習算
法和理論,求解連續空間Markov決策問題的梯度增強學習演算法以及進化一
梯度混合增強學習演算法,基於核的近似動態規劃演算法,增強學習在移動機器
人導航與控制中的應用等。本書是作者在多個國家自然科學基金專案資助
下取得的研究成果的總結,意在推動增強學習與近似動態規劃理論與應用
的發展,對於智慧科學的前沿研究和智慧學習系統的應用具有重要的科學
意義。
本書可作為高等院校與科研院所中從事人工智慧與智慧資訊處理、機
器人與智慧控制、智慧決策支援系統等專業領域的研究和教學用書,也可作
為自動化、電腦與管理學領域其他相關專業師生及科研人員的參考書。
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。※ 二手徵求後,有綁定line通知的讀者,
該二手書結帳減5元。(減5元可累加)
請在手機上開啟Line應用程式,點選搜尋欄位旁的掃描圖示
即可掃描此ORcode
|
||||||||||||||||||
|
||||||||||||||||||
|