隨機對策是一類帶有隨機因素的多步對策。對策論亦稱博弈論,是運籌學的一個重要分支。它所研究的是n(n≥2)個決策者在某種對抗或競爭的局勢下,如何各自作出決策,從而使自己得到自己儘可能最有利的結果。隨機對策是一類帶有隨機因素的多步對策。
基本介紹
- 中文名:隨機對策
- 外文名:stochastic game
- 適用範圍:數理科學
定義,對策論,多步對策,
定義
隨機對策是一類帶有隨機因素的多步對策。
隨機對策[stochastic game] 隨機對策的框架如下:
狀態空間是一個可測空間。
對任意,第 i 個局中人的行動空間是可測空間,記。
是一個轉移機率,對任意,P(a/ω,s)表示今天的狀態為,行動為時明天的狀態為的機率。
對任意,第 i 個局中人的支付函式,其中為折扣因子,是第 i 個局中人的階段支付函式,為初始狀態,為階段 t 時的行動,狀態由轉移機率和確定。
對策論
[game theory]
1944年,諾貝爾經濟獎授予納什(J.F.Nash)等3位對策論學者,從而確認了對策論對經濟論對核心重要性。
除此之外,對策論在政治學、軍事學、心理學、生物學等領域都有非常廣泛和深刻的套用。
多步對策
[multistep game]
多步對策指局中人的每個策略須由多次行動實現的對策。在多步對策中,每個局中人的策略由一系列行動所組成。通常,局中人最初選擇的只是他的一個策略中的某一具體行動,在其他局中人選擇了他們的策略中的某一行動後,這個局中人再採取新的行動,直到對策結束。
例如,象棋、橋牌比賽等均可視為多步對策。