隨機對策

定義

隨機對策是一類帶有隨機因素的多步對策。

隨機對策[stochastic game] 隨機對策的框架如下：

狀態空間是一個可測空間

。

對任意

，第 i 個局中人的行動空間是可測空間

，記

。

是一個轉移機率，對任意

，P(a/ω，s)表示今天的狀態為

，行動為

時明天的狀態為

的機率。

對任意

，第 i 個局中人的支付函式

，其中

為折扣因子，

是第 i 個局中人的階段支付函式，

為初始狀態，

為階段 t 時的行動，狀態

由轉移機率和

確定。

[game theory]

對策論亦稱博弈論，是運籌學的一個重要分支。它所研究的是n(n≥2)個決策者在某種對抗或競爭的局勢下，如何各自作出決策，從而使自己得到自己儘可能最有利的結果。

1944年，馮·諾依曼(J.von Neumann)和莫根施特恩(O.Morgenstern)出版了《博弈論與經濟行為》一書，宣告了對策論的誕生，也奠定了對策論的基礎。

1944年，諾貝爾經濟獎授予納什(J.F.Nash)等3位對策論學者，從而確認了對策論對經濟論對核心重要性。

除此之外，對策論在政治學、軍事學、心理學、生物學等領域都有非常廣泛和深刻的套用。

[multistep game]

多步對策指局中人的每個策略須由多次行動實現的對策。在多步對策中，每個局中人的策略由一系列行動所組成。通常，局中人最初選擇的只是他的一個策略中的某一具體行動，在其他局中人選擇了他們的策略中的某一行動後，這個局中人再採取新的行動，直到對策結束。

例如，象棋、橋牌比賽等均可視為多步對策。