動態規劃模型

用動態規劃方法解決決策過程的最最佳化問題所需建立的模型。一般動態規劃模型包括以下幾個組成部分:(1)時間參量集。由於實際的決策過程是隨時間而變化的,所以時間參量是模型的一個組成部分。若決策是在離散的時間上採取的,則時間參量是離散的,相應的決策過程是離散過程;若決策是在連續的時間上採取的,則時間參量是連續的,相應的決策過程是連續過程。(2)狀態空間。在決策過程中,狀態起著描述過程的作用,各個時刻的狀態一旦確定,整個過程便隨之確定。當決策的方式給定時,狀態隨時間的變化規律可能是確定性的,也可能是隨機性的,相應的決策過程稱為確定性決策過程或隨機性決策過程。(3)決策空間。在決策過程中,決策是影響或控制過程發展的外加因素,它是一個適當定義的決策集合中的元素,該集合稱為決策空間。在特殊情況下,它是一個數或向量,稱為決策變數。

除了上述三個組成部分外,動態規劃模型還包括容許策略集的族、狀態轉移規律、指標、初始和終止條件等。決策過程的最最佳化,就是要在容許策略集內求出策略,使其能滿足初始和終止條件,並在某種意義上使指標達到最佳值。

相關詞條

熱門詞條

聯絡我們