馬爾可夫決策法

馬爾可夫決策法是指用馬爾可夫轉移矩陣進行決策的方法,屬於機率型決策技術。馬爾可夫決策法的基本原理是:決策者在近期內不能確知某一自然狀態出現的機率,但知道各自然狀態之間機率分布變化即轉移矩陣時,可以根據轉移矩陣求出未來環境各自然狀態出現的穩定機率,再利用期望值決策法或確定型決策技術選取最佳方案。

其決策步驟如下:(1)構想未來環境可能出現的自然狀態,並求出自然狀態間的正規轉移矩陣P。(2)利用馬爾可夫正規轉移矩陣的性質,求出各自然狀態出現的穩定機率。(3)設計行動方案。(4)根據行動方案的收益期望值大小選取最佳方案。

相關詞條

熱門詞條

聯絡我們