精煉貝葉斯均衡

基本解釋

這個概念是完全信息動態博弈的子博弈精煉納什均衡與不完全信息靜態均衡的貝葉斯（納什）均衡的結合。具體來說，精煉貝葉斯均衡是所有參與人戰略和信念的一種結合。它滿足如下條件：第一，在給定每個參與人有關其他參與人類型的信念的條件下，該參與人的戰略選擇是最優的。第二，每個參與人關於其他參與人所屬類型的信念，都是使用貝葉斯法則從所觀察到的行為中獲得的。

運用子博弈精煉均衡概念的邏輯，將從每一個信息集開始的博弈的剩餘部分稱為一個“後續博弈”(不同於子博弈，因為子博弈必須開始於單結信息集，並且不能切割信息集)，

一個“合理”的均衡要求，給定每一個參與人有關其他參與人類型的後驗信念，參與人的戰略組合在每一個後續博弈上構成貝葉斯均衡。

假定參與人(在所有可能的情況下)根據貝葉斯法則修正先驗信念，並且，每個參與人都假定其他參與人選擇的是均衡戰略。

假定i屬於類型q的先驗機率是p(q)³0，並且SKp(q)=1；給定i屬於q，i選擇a的條件機率為p(a|q)，並且SHp(a|q)=1。那么，i選擇a的邊緣機率(全機率)是

Prob(a)=SKp(a|q)p(q)

即參與人i選擇行動a的總機率是每一種類型的i選擇a的條件機率p(a|q)的加權平均，權數是他屬於每種類型的先驗機率p(q)。

問題是：假如我們觀測到i選擇了a，i屬於類型q的後驗機率是多少？

我們用Prob(q|a)代表這個後驗機率，即給定a的情況下，i屬於類型q的機率。根據條件機率或乘積機率公式，

Prob(q,a)º p(a|q)p(q)

º Prob(q|a)Prob(a)

也就是說，i屬於q並選擇a的聯合機率，等於i屬於q的先驗機率乘以q類型的參與人選擇a的機率，或等於i選擇a的總機率乘以給定a情況下i屬於q的後驗機率。

因此，Prob(q|a)º p(a|q)p(q)/Prob(a)

º p(a|q)p(q)/ SKp(a|q)p(q)

這就是貝葉斯法則。精煉貝葉斯均衡假定參與人是根據貝葉斯法則修正先驗機率的。

貝葉斯法則要求Prob(a)>0即參與人i必須以正的機率選擇a，否則，後驗機率沒有定義。

如果Prob(a)=0，我們允許Prob(q|a)在[0,1]區間取任何值，只要所取的值與均衡戰略相容，即均衡仍然成立。

在動態博弈中，Prob(a)=0對應的是非均衡路徑上的信息集。

後驗機率Prob(q|a)不僅依賴於先驗機率p(q)，而且依賴於參與人“認為”i是類型q並選擇行動a的條件機率p(a|q)。

在精煉貝葉斯均衡中，參與人“認為”的條件機率必須是正確的。

假定有n個參與人，參與人i的類型是qiÎQi，qi是私人信息，pi(q-i|qi)是屬於類型qi的參與人i認為其他n-1個參與人屬於類型q-i = (qi, …, qi-1, qi+1, …, qn)的先驗機率；

精煉貝葉斯均衡

基本介紹

基本解釋

案例分析

相關詞條

熱門詞條