最少的15名當中,則有14名都是“惡”的。“一報還兩報”的戰略未能獲勝,因為許多“惡戰略”都費盡了心機來利用對方的寬容。
這一事實導致一個重要的發現:一種戰略的成功取決於它與之較量的那些戰略的性質。理查德·道金斯在他那本深受讀者歡迎的《自私的基因》(1974年初版,1990年、2006年再版)一書中指出,阿克塞爾羅德舉辦的比賽是像橄欖球聯賽一樣採用了迴圈賽制。參賽的每一戰略都需要跟別的戰略交鋒,全贏者才勝出。“一報還兩報”若在第一輪推出,可能勝出,但是它在第二輪推出就不行了,因為第二輪“善”者比例低於第一輪。“一報還一報”能勝出,是因為“善”者在第二輪畢竟也還多於“惡”者,否則它也會敗。迴圈制不同於道金斯所說的“進化上的穩定策略”(ESS),道金斯說,凡是種群的大部分成員採用某種策略,而這種策略的好處為其他策略所比不上的,這種策略便是進化上的穩定策略。
阿克塞爾羅德仍然用第二輪參賽的63種戰略進行了第三輪比賽,以尋找一種能反映達爾文學說“自然選擇”原則的“進化穩定策略”。在這新的一輪比賽中,63種電腦程式被列為“第一代”。“第一代”比賽結束時,記錄下每一種電腦程式及其“後裔”的百分比。幾代之後,有些程式比例減少,到了“第200代”,多數“惡戰略”已遭淘汰,別的戰略繼續比賽。到了“第1000代”左右時,每一戰略在總數中所佔百分比停止變化,終於達到了穩定狀態。在6場比賽中,“一報還一報”勝了5場。另5種類似的戰略成績也不錯,其中一種在第六場獲勝。有一種叫做“哈林頓”的“惡戰略”熬過了“第200代”,但隨後一些“善”的和“寬容”的戰略敗出了比賽以後,這一“惡戰略”找不到它易於擊敗的靶子,終於在接近“第1000代”時敗亡。
政治博弈(3)
阿克塞爾羅德把“一報還一報”稱做“集體穩定戰略”,因為當“惡戰略”全部消失以後,剩下的全是“善戰略”,只會彼此合作和共存。換句話說,“一報還一報”不是真正的“進化穩定策略”(ESS),儘管“惡戰略”甚至是最惡的“永遠背叛”(一種真正不受侵犯的ESS)都侵犯不了“一報還一報”,但“永遠合作”(又稱做“一味相信別人的傻子”)之類的“善戰略”卻能夠侵犯它。羅伯特·博伊德和傑弗裡·洛伯鮑姆遵循阿克塞爾羅德的研究,考察了“一報還兩報”與“有疑心的一報還一報”(與“一報還一報”相同,但第一步不是“合作”而是“背叛”)二者的混合。“有疑心的一報還一報”一開始出“惡”招,引來雙方“彼此背叛”,因此在“一報還一報”佔絕大多數時情況不妙,但更有寬容心的“一報還兩報”卻讓它有勝出的機會。這意味著“一報還兩報”與“有疑心的一報還一報”的混合能使“一報還一報”受滲透。因此,博伊德和洛伯鮑姆認為類似的“善/寬容”與“微惡”戰略的組合能有侵犯力(滲透力),在人類生活中可能亦是如此。
阿克塞爾羅德還透過第一次世界大戰期間西線停火這一著名事例,談到“自己活也讓別人活”戰略。這一事例表示“一報還一報”甚至能滲透到戰爭期間彼此“永遠背叛”的人群之間,合作能出現在彼此毫無友誼的人群之間。在《自私的基因》一書中,道金斯進一步探討了“永遠背叛”和“一報還一報”組成的“雙穩定系統”。他發現這取決於“一報還一報”的最初數量及其優於“永遠背叛”的效果如何。
若“永遠背叛”佔統治地位,“一報還一報”就可能透過“親密度”和“粘連度”而“串在一起”(這聽起來頗像是中國人的關係文化,是吧?),表現為“人們傾向於繼續生活在故鄉及其附近”。①相形之下,“永遠背叛”卻做不到這一點。因此,“一報還一報”享有較高的穩定性,幾千年之後可能最終在數量上超過“永遠背叛”。
那麼,以上這些想法對於理解中國的文化,尤其是理解中國的政治文化,有什麼意義呢?以下幾點應有助於我們理解中國政治文化的現實、中國公民文化的改善,以及未來的不同文化(包括中美兩國文化)之間的合作方向。
一、阿克塞爾羅德研究的主題是在一個沒有中央權威的利己主義者世界上出現合作的條件。在他看來,合作是有持續力的,而最大的問題是怎樣讓合作開一個頭。促進合作的原則是“使未來比現在更加重要,改變博弈者每走一步的4種可能結果的得益;讓參賽者懂得促進合作的價值、事實和技巧”。②就中國的政治社會風氣而言,這幾條原則似乎都