後向歸納法

基本內容

後向歸納法是一種逆推的動態規劃方法，即從最後一項逐次往前推導，適合於結果比較明確，而想預知開始的一類問題。瞬時不確定性決策即具有這一特點。這類問題要想有一個比較好的結果，即結果是比較明確的，但是由於每一步都涉及到決策，由於不同的博弈會帶來不同的結果，可以引入機率( 機率可以用別的數學方法求出，或者憑經驗給出。也可以從後往前推，套用後向歸納法進行求解。

比較

前向歸納法正好與後向歸納法相反，前向歸納法是指參與人通過其他參與人早期的、過去的決策推斷出一些信息，以幫助求解動態博弈。它是從一個初始或者說從現在水平出發，去推導後一時期。後向歸納法是求解動態博弈的經典算法，是一種逆推的動態規劃方法，即從最後一項逐次往前推導。

後向歸納法雖然比較實用，但是由於要一個時期、一個時期地重複依次計算，所以需耗費大量時間。而前向歸納法可以避免這種重複過程。

動態認知

在動態博弈中，關於選手理性選擇的刻畫往往是基於一類靜態的認知模型而展開進行的。在這類認知模型中，不僅需要描述出理性決策路徑上選手們的知識（或信念），而且還需要說明當一個不是理性決策路徑上的行動如果被對手選擇到時，每個選手原有的初始知識（或信念）、在此情形下選手對於原有知識（或信念）所進行的修正以及其對手關於該選手修正後的知識（或信念）等。例如，在一個動態博弈中，選手 2 初始時知道（或相信）理性選手1應該選擇馬上結束博弈的行動，然而，他還需要知道（或相信），如果選手 1 讓博弈繼續進行，給出機會讓他進行選擇時，選手1所基於的知識（或信念）是什麼，以引導選手2，在此情形下做出理性選擇。因此，這類模型必然會涉及複雜的條件知識（或信念）系統或層級式系統和信念修正的問題。同時，基於此類模型，選手初始時理性的公共知識是不能蘊涵後向歸納法的結果。

後向歸納法

基本介紹

基本內容

比較

動態認知

相關詞條

熱門詞條