顫抖手精煉均衡

意義

從博弈論中我們知道，澤爾騰的這種“顫抖手均衡(”也是一種精煉納什均衡。大致說來，澤爾騰(1975)假定，在博弈中存在一種數值極小但又不為0的機率，即在每個博弈者選擇對他來說所有可行的一項策略時，可能會偶爾出錯，這就是所謂的“顫抖之手”。因之，一個博弈者的均衡策略是在考慮到其對手可能“顫抖”(偶爾出錯)的情況下對其對手策略選擇所作的最好的策略回應。單從這一點來看，在演進博弈論中，最初的演進穩定性的出現，並不完全來自博弈雙方的理性計算，而實際上可能是隨機形成的(往往取決於博弈雙方“察言觀色”的一念之差)。按照這一分析思路，我們也可以認為，人們對一種習俗(演進穩定性)的偏離，也可能出自澤爾騰所說的那種人們社會博弈中的“顫抖”。

價值

為了說明顫抖手精煉均衡的價值,我們考慮一個具有兩個“委託人—代理人”對和兩種自然狀態的對稱支付模型。設代理人1的策略有:α1(積極工作)和α2(偷懶);代理人2的策略同樣有β1(積極工作)和β2(偷懶)。相應於兩個代理人的策略,在自然狀態s1和s2下,每個委託人的收益如下:

狀態s1(壞)　狀態s2(好)

β1　β2　 β1　β2

α1(c1,c2)　(d1,a2) α1(d1,d2)　(e1,b2)

α2(a1,d2)　(b1,b2) α2(b1,e2)　(c1,c2)

其中,0<aj<bj<cj<dj<ej,j=1,2。這意味著當自然狀態“壞”時,每個代理人都必須採用積極”的策略才可能使自己的委託人得到中等以上的收益(即不小於cj);而當自然狀態“好”時,兩代理人都選“偷懶”也可使各自的委託人得到cj的收益。設代理人j(j=1,2)在他的委託人的利潤不小於cj單位時,都得到 Uj;否則所得為-M。假設代理人j選擇“積極”策略時,就沒有額外收益,而選擇“偷懶”時,可有li>0單位的額外收益。因此,代理人的收益,可用如下標準形的二人非零和博弈給出:

狀態s1(壞)

α1　β1　( U1, U2)　β2　( U1-M)

α2　　(-M, U2)　 (-M,-M)

狀態s2(好)

α1　β1　( U1, U2)　β2　( U1,-M)

α2　 (-M, U2)　 ( U1+l1, U2+l2)

這樣,在好的環境s2中,代理人之間的博弈有2個納什均衡:(α1,β1)對應收益對( U1, U2)和(α2,β2)對應收益對( U1,+l1, U2+l2);而在壞的狀態s1中,代理人間的博弈只有一個非合作均衡(α1,β1)對應收益對( U1, U2)。觀察上述博弈,我們發現在狀態s2中,(α1,β1)更加有效率(使每個委託人的收益都較大),然而兩個代理人卻更喜歡均衡(α2,β2),因為這個均衡使他們的效用從( U1, U2)升至( U1,+l1, U2+l2)。但是,如果這兩個納什均衡中只有(α1,β1)是顫抖手精煉均衡,代理人就可能不再偏愛均衡(α2,β2)。

顫抖手精煉均衡

基本介紹

意義

價值

相關詞條

熱門詞條