“人工智能超入門叢書”致力於面向人工智能各技術方向零基礎的讀者,內容涉及數據素養、機器學習、視覺感知、情感分析、搜索算法、強化學習、知識圖譜、專家系統等方向。本叢書體系完整、內容簡潔、語言通俗,綜合介紹了人工智能相關知識,並輔以程序代碼解決問題,使得零基礎的讀者能夠快速入門。
《強化學習:人工智能如何知錯能改》是“人工智能超入門叢書”中的分冊,以科普的形式講解了強化學習的核心知識,內容生動有趣,帶領讀者走進強化學習的世界。本書包含強化學習方向的基礎知識,如動態規劃、時序差分等,讓讀者在開始學習時對強化學習有初步的認識;之後,通過對馬爾可夫決策過程及貝爾曼方程的解讀,逐漸過渡到強化學習的關鍵內容;同時,本書也重點解析了策略迭代與價值迭代兩種核心算法,也對蒙特卡洛方法、時序差分算法、深度強化學習及基於策略的強化學習算法進行了深度剖析。本書內容結構完整、邏輯清晰、層層遞進,並配有相關實例與代碼,讓讀者在閱讀學習過程中能夠加深理解。
本書適合強化學習及人工智能方向的初學者閱讀學習,也可供高等院校人工智能及計算機類專業的師生參考。