日前在本欄提及「囚徒困境」問題,引起一些朋友們的興趣。為便於說明和分析,問題可表述為二人對弈的遊戲,二人分別扮演「囚徒甲」和「囚徒乙」,各自可採取「合作」或「背叛」兩種策略。「合作」即互相維護,拒絕招供;「背叛」即告發對方,出庭作證。遊戲規則:倘二人同取合作,各判囚1年(因證據不足而改判較輕罪行);二人都背叛,則各判3年。倘一人合作、另一人背叛,則背叛者(因協助破案)當庭釋放,而合作者(因不肯認罪)被重判5年。
二人都不知道對方採取甚麼策略,各自都理性地為自己爭取最短的刑期。甲會作這樣的盤算:「假設乙合作;如果我也合作,將被判1年,但如果我背叛,便可當庭釋放。再假設乙背叛;如果我合作,將被重判5年,如果我也背叛,只判3年。即是說,不管乙採取甚麼策略,選擇背叛都比選擇合作對我有利。」
乙也會有同樣的盤算,於是二人都決定背叛。如果二人重複玩這遊戲,每次都不知道對方的策略,那末各自出於對自己最有利的考慮,必會繼續選擇背叛。這穩定的「背叛——背叛」策略組合,就是「納殊平衡」。可以看到,如果二人都選擇合作,其實得到最大的共同利益(各判1年,合共2年);但因為各自只考慮個人利益,便得到對共同利益最壞的結果(各判3年,合共6年)。
如果重複玩這遊戲,但以多次結果累積來計算成績,那就會出現不同的情況。在多次因雙方都背叛而同被判3年之後,其中一人,譬如甲,可能決定尋求改變,不讓這局面繼續下去。於是他冒著對方繼續背叛、自己被重判的風險,毅然轉為合作,向乙釋出善意。
乙看到甲的這個轉變,如果仍然只考慮個人眼前利益,繼續背叛以換取自己獲釋,那末甲必然立即轉回原來的背叛策略,以保障自己。但是,如果乙回報甲的善意,接下來也轉為合作,那就可能建立新的納殊平衡,其後二人每次都合作,獲得最佳的共同利益,達致雙贏。
當然,假如過了若干次,其中一人抵不住貪念,忽然背叛,那就破壞了互信,促使對方也轉回背叛,回復到雙輸的局面。(完)
互疑雙輸