{{ _getLangText('m_detailInformation_goodsActivityText') }}
{{ item.activityName }}
{{ _getLangText('m_detailInformation_goodsActivityBuyButText') }}

{{ _getLangText('m_detailIntroduction_goodsIntroductionText') }}

針對強化學習的關鍵概念和演算法,提供清晰而簡單的說明


什麼是強化學習

強化學習是學習該做什麼(如何將當前情形映射到動作上),以便最大化一個獎勵訊號數值。學習者不會被告知要採取哪些動作,而是必須透過嘗試來發現哪些動作會產生最大的回報。在最有趣和最具挑戰性的案例中,動作不僅會影響當下的獎勵,同時也會影響下一個情境,並且影響後續所有的獎勵。試誤搜尋和延遲獎勵這兩個特性,是強化學習中的兩個最重要的區別特徵。


本書精采內容包括:

.涵蓋所有強化學習演算法的核心概念

.解決有限馬可夫決策問題的三種基本方法

.近似最佳策略進行控制的方式

.介紹並分析資格痕跡演算法的機制

.強化學習與心理學和神經科學之間的關係

.強化學習的相關應用與未來強化學習研究中一些正在進行的前瞻技術


{{ isMore ? _getLangText('m_detailIntroduction_goodsIntroductionHideText') : _getLangText('m_detailIntroduction_goodsIntroductionShowText') }}

{{ _getLangText('m_detailAuthorBookList_titleText') }}

{{ _getLangText('m_asideBuyList_titleText') }}

{{ _getLangText("m_recently_viewed_products_titleText") }}
{{ items.name }}
{{ bookInfoObj[items.productId].author }}