混合策略

基礎知識

策略：參與人在給定信息集的情況下選擇行動的規則，它規定參與人在什麼情況下選擇什麼行動，是參與人的“相機行動方案”。

純策略：如果一個策略規定參與人在每一個給定的信息情況下只選擇一種特定的行動，稱為純策略，簡稱“策略” ，即參與人在其策略空間中選取唯一確定的策略。

混合策略：如果一個策略規定參與人在給定的信息情況下以某種機率分布隨機地選擇不同的行動，稱為混合策略。參與人採取的不是明確唯一的策略，而是其策略空間上的一種機率分布。

混合策略擴展博弈：博弈方在混合策略的策略空間(機率分布空間)的選擇看作一個博弈，就是原博弈的“混合策略擴展博弈”。

納什均衡：一般將嚴格占優策略均衡、重複剔除的占優策略均衡、純策略納什均衡和混合策略納什均衡統稱為納什均衡。嚴格占優策略均衡是重複剔除的占優策略均衡的特例；重複剔除的占優策略均衡是純策略納什均衡的特例；純策略納什均衡是混合策略納什均衡的特例。

混合策略納什均衡(MNE)：由最優的混合策略構成的混合策略組合。

在完全信息博弈中，如果在每個給定信息下，只能選擇一種特定策略，這個策略為純策略。如果在每個給定信息下只以某種機率選擇不同策略，稱為混合策略。

混合策略是純策略在空間上的機率分布。純策略可以理解為混合策略的特例，即在諸多策略中，選擇該純策略的機率為1，選其他純策略的機率為0。純策略的收益可以用效用表示，混合策略的收益只能以預期效用表示。

兩個參與人各拿一枚硬幣，並選擇出正面向上還是反面向上。若兩枚硬幣是一致的(即全部正面或全部反面)，則參與人2贏走參與人1的硬幣；若兩枚硬幣不一致(一正一反)，參與人1贏得參與人2的硬幣。支付如表1：

上述博弈的特徵是：

表1