第1部分(1 / 4)

小說:中國熱 作者:換裁判

政治博弈(1)

密歇根大學政治學教授羅伯特·阿克塞爾羅德於20世紀70年代末舉行的一次電腦程式比賽,已成為成功的社會研究的一個經典故事。它激起了人們深刻的思索,被公認為20世紀最重要的實驗之一。阿克塞爾羅德當時是對國際政治形勢,尤其是對核戰爭的危險感到擔心,因而研究博弈論以及重複進行的“囚徒困境”遊戲。他研究了人工智慧,再研究電腦棋賽,然後想到邀請專家們以電腦程式的形式提出他們各自所主張的戰略,透過多次重複的“囚徒困境”進行較量,可以有效地對這些戰略作出評估。

在第一輪比賽中,他邀請的14位專家各自以電腦程式的形式提出自己的戰略。這些專家包括政治學、數學、心理學、電腦科學和經濟學的教授。阿克塞爾羅德自己又新增了“隨機程式”,即以50%的機率選取“合作”或“背叛”。14種戰略加上“隨機戰略”均一對一進行重複的“囚徒困境”比賽,即15×15共225場比賽,每一配對對弈200次。每次按照以下四種情況給每一程式打分:

a。“彼此合作”:各得3分;

b。一種情況是甲方“背叛”乙方“合作”,另一種情況是甲方“合作”乙方“背叛”:“背叛”一方得5分,“合作”一方得0分(作為易受騙者的代價);

c。“彼此背叛”:各得1分。

“囚徒困境”是一種非合作性、非零和博弈的遊戲,並不是每次都一勝一負,不是一方之所得即另一方之所失。“一方背叛”得分最高,“彼此合作”次之,“彼此背叛”再次之,“一方合作”而一方受騙則墊底,但“一方背叛”與“一方受騙”二者相加除以2的平均分低於“彼此合作”的得分:(5+0)÷2<3,這一點成為合作的刺激因素。“困境”在於,你不知道對方打的是什麼牌,所以從利己著想,選擇“背叛”最合適:你“背叛”對方“合作”,你可得5分;若對方也選擇“背叛”,你仍可得1分。如此看來,理性的博弈者似乎都只會選擇“背叛”,但雙方都各得1分,並非最佳結果,不如“彼此合作”的各得3分。

在比賽中,一種戰略可能達到的最高分為15000分(15×200×5),最低則是0分。但能指望得到的最高分,即200次均得3分,共600分。每次都指望對方受騙而自己總得5分是不可能的,因為對方也會以“背叛”進行報復,結果只有各得1分。

在全部比賽結束後,得分最高的是多倫多大學心理學和博弈論教授阿納托爾·拉波波特所提交的“一報還一報”戰略,它簡便易行,即頭一回選擇“合作”,然後,對方選擇什麼,自己下一回也選擇什麼。

具有諷刺意味的是,除了“隨機程式”以外,得分最差的一個程式恰恰是設計得最複雜的一種程式。15種戰略中,有8種是首先選擇“合作”,被列為“善戰略”,另外7種戰略是首先選擇“背叛”,而且總想誘使對方受騙,被列為“惡”戰略。最後,“善戰略”總分均高於“惡戰略”。書 包 網 txt小說上傳分享

政治博弈(2)

“一報還一報”不僅善良,而且不刻意追求高分,又能寬容(一開始雖然報復對方,但對方態度變好了,就不再記仇)。寬容心差,就容易陷入雙方老是“彼此背叛”的狀態。“一報還一報”是15種戰略中最簡易又最善良的一種,它最後得分最高,是許多人所未想到的。“一報還一報”的特點:一是“善良”,決不首先“背叛”。二是“反應快”,對方若“背叛”,馬上就以“背叛”還擊,決不猶豫。三是“寬容”,對方若是態度變為“合作”,就不記前仇,立即回應以“合作”。四是“無忌妒之心”,不因對方玩弄心計一時得分高而自己也玩弄心計。五是“簡便易行”,始終堅持“一報還一報”,易於堅持到底,態度明朗,對方明白了也會照樣做。

阿克塞爾羅德總結了第一輪比賽的結果,宣佈舉行第二輪比賽。這次參賽的程式有63個,其中包括那個“隨機程式”,還有約翰·史密斯提出的一種更寬厚的“一報還兩報”,即遭到對方兩次“背叛”後才予以還擊。這一輪的場次不加限制,阿克塞爾羅德在他於1984年出版的《合作的進化》一書中指出這樣做是因為對未來的關注可以促進合作。有些人讀了阿克塞爾羅德對第一輪比賽的分析以後,研究了怎樣利用那些“善戰略”和“寬容戰略”的方案,提出了一些新的“惡戰略”,但最後還是輸了。拉波波特的“一報還一報”再次獲勝。得分最高的前15名中,有14名都是“善”的,而得分

本站所有小說均來源於會員自主上傳,如侵犯你的權益請聯絡我們,我們會盡快刪除。
書首頁 報錯 目錄 下一頁
本站所有小說為轉載作品,所有章節均由網友上傳,轉載至本站只是為了宣傳本書讓更多讀者欣賞。
Copyright © 2025 https://www.hxsk.tw All Rights Reserved