顫抖手精鍊均衡

標籤: 暫無標籤

9

更新時間: 2013-09-04

廣告

顫抖手精鍊均衡是澤爾騰提出的對納什均衡的一個改進,是在博弈中存在一種數值極小但又不為0的概率,即在每個博弈者選擇對他來說所有可行的一項策略時,可能會偶爾出錯,價值意義重大。

顫抖手精鍊均衡(trembling hand perfect equilibrium)

 

顫抖手精鍊均衡 -概念


「顫抖手精鍊均衡」概念是澤爾騰提出的對納什均衡的一個改進。顫抖手精鍊均衡的基本思想是:在任何一個博弈中,

顫抖手精鍊均衡顫抖手精鍊均衡
每個局中人都有一定的犯錯誤的可能性(類似一個人用手抓東西時,手一顫抖,他就抓不住他想抓的東西)。一個策略對是一個顫抖手精鍊均衡時,它必須具有如下性質:各局中人i要採用的策略,不僅在其他局中人不犯錯誤時是最優的,而且在其他局中人偶爾犯錯誤(概率很小,但大於0)時還是最優的。可以看出,顫抖手精鍊均衡是一種較穩定的均衡。

從博弈論中我們知道,澤爾騰的這種「顫抖手均衡(trembling hand equilibrium)」也是一種精鍊納什均衡。大致說來,澤爾騰(1975)假定,在博弈中存在一種數值極小但又不為0的概率,即在每個博弈者選擇對他來說所有可行的一項策略時,可能會偶爾出錯,這就是所謂的「顫抖之手」。因之,一個博弈者的均衡策略是在考慮到其對手可能「顫抖」(偶爾出錯)的情況下對其對手策略選擇所作的最好的策略回應。單從這一點來看,在演進博弈論中,最初的演進穩定性的出現,並不完全來自博弈雙方的理性計算,而實際上可能是隨機形成的(往往取決於博弈雙方「察言觀色」的一念之差)。按照這一分析思路,我們也可以認為,人們對一種習俗(演進穩定性)的偏離,也可能出自澤爾騰所說的那種人們社會博弈中的「顫抖」。

廣告

顫抖手精鍊均衡 -價值


為了說明顫抖手精鍊均衡的價值,我們考慮一個具有兩個「委託人—代理人」對和兩種自然狀態的對稱支付模型。設代理人1的策略有:α1(積極工作)和α2(偷懶);代理人2的策略同樣有β1(積極工作)和β2(偷懶)。相應於兩個代理人的策略,在自然狀態s1和s2下,每個委託人的收益如下:

   狀態s1(壞)            狀態s2(好) 

  β1   β2     β1    β2 

α1(c1,c2) (d1,a2) α1(d1,d2) (e1,b2) 

α2(a1,d2) (b1,b2) α2(b1,e2) (c1,c2)

其中,00單位的額外收益。因此,代理人的收益,可用如下標準形的二人非零和博弈給出:

  狀態s1(壞)   

α1  β1 ( U1, U2)    β2 ( U1-M)

α2    (-M, U2)   (-M,-M) 

  狀態s2(好)

α1  β1 ( U1, U2)    β2 ( U1,-M)

α2  (-M, U2)   ( U1+l1, U2+l2)

這樣,在好的環境s2中,代理人之間的博弈有2個納什均衡:(α1,β1)對應收益對( U1, U2)和(α2,β2)對應收益對( U1,+l1, U2+l2);而在壞的狀態s1中,代理人間的博弈只有一個非合作均衡(α1,β1)對應收益對( U1, U2)。觀察上述博弈,我們發現在狀態s2中,(α1,β1)更加有效率(使每個委託人的收益都較大),然而兩個代理人卻更喜歡均衡(α2,β2),因為這個均衡使他們的效用從( U1, U2)升至( U1,+l1, U2+l2)。但是,如果這兩個納什均衡中只有(α1,β1)是顫抖手精鍊均衡,代理人就可能不再偏愛均衡(α2,β2)。

廣告