落霞小說

第十二章 好人終有好報 · 3

[英]理查德·道金斯2018年11月27日Ctrl+D 收藏本站

關燈 直達底部

你也許還記得,進化穩定策略在眾多的種群策略中占有許多席位,也一直得到不錯的結果。如果說“針鋒相對”是一種進化穩定策略,這便是說,“針鋒相對”策略在充滿“針鋒相對”策略的大環境下能得到不錯的結果。這便是一種特殊的“強勁”。作為進化論者,我們一直很想找到一種唯一的、可以直接決定結果的“強勁”。為什么這很重要呢?因為在達爾文主義的世界里,成功并不是贏得金錢,而是獲得后裔。對于一個達爾文主義者,一個成功的策略將是一個在種群策略中數量眾多的策略。如果這個策略要保持成功,它必須在同類眾多時——也就是充滿了自身復制的大環境中得到特別好的結果。

阿克塞爾羅德又模仿自然選擇,進行了第三場競賽來尋找進化穩定策略。事實上,他并沒有稱之為第三次競賽,因為他并沒有邀請新的參賽者,而只是使用了第二次競賽中的63個策略。但我覺得稱它為第三次競賽比較合適,它和前兩次“循環賽”有根本性的不同。

阿克塞爾羅德將這63個策略再次丟給計算機,來制造進化演替的“第一代”。 “第一代”的大環境中由這63個策略組成。結束后,贏家不再得到“金錢”或者“分數”,而是與其完全相同的“后代”。世世代代如此傳遞,一些策略逐漸變得數目稀少,甚至完全絕跡,另一些策略則數目眾多。當環境中策略的比例變化,博弈中策略的出牌也在隨之變化。

最終在1 000代之后,種群不再變化,環境也沒有再改變,穩定的狀態已經形成。在此之前,各種策略的命運起伏不定,正如我模擬的“騙子”、“傻瓜”和“斤斤計較者”的命運一樣。一些策略在博弈開始便已經滅絕,大多數則在200代之后徹底滅絕。在那些惡意策略中,有一兩個一開始蓬勃發展,但它們的繁榮正如我的模擬預測一樣,只是曇花一現。唯一活過200代的一個策略叫做“哈靈頓”(Harrington)。它的數目在前150代中直線上升,而后逐漸減少,在1 000代之后終于完全滅絕。“哈靈頓”短期繁榮的原因跟我的“騙子”是一樣的。當那些如“兩報還一報”之類的老實人(過于寬容)還在世時,它欺負它們以獲得發展。但當這些老實人已經消失之后,“哈靈頓”失去了獵物,也跟隨著它們的命運而滅絕。剩下的策略都類似于“針鋒相對”,既善良又容易被煽動報復。

“針鋒相對”本身在第三輪競賽中,6次中有5次得了第一,重復其在第一、二次競賽時的好運。另外5個雖善良但容易報復的策略則幾乎和“針鋒相對”一樣成功(在種群數目上),還有一個策略甚至贏了第6次博弈。當所有惡意策略都滅絕后,所有的善良策略與“針鋒相對”都無法辨認彼此了,因為它們都很善良,只是簡單與所有對手“合作”到底。

這種“無法辨認”情況使得“針鋒相對”在嚴格意義上不是一個真正的進化穩定策略,即使它看起來確實很像。一個策略要成為進化穩定策略,當它是常見策略時,它不可被少數變異策略所同化。雖然“針鋒相對”不會被任何惡意策略同化,但另一個善良策略則可能做到。正如我們所看到的,在善意策略的群體里,它們面目模糊,行為相同,始終合作。因此,有一些其他善良策略,比如“永遠合作”這種選擇優勢不如“針鋒相對”的策略,也可以溜進種群里而不被發現。所以嚴格地說,“針鋒相對”并不是進化穩定策略。

你也許會認為,如果世界充滿善良,我們便可以認為“針鋒相對”是一個進化穩定策略了。但即使如此,你可以看到接下來的故事。“永遠合作”與“針鋒相對”不同,它并不能抵擋一些惡意策略的入侵。比如,“永遠背叛”的攻擊便可以打敗“永遠合作”,它可以每次都得到“背叛誘惑”的最高分。類似“永遠背叛”這樣的惡意策略會減少過分善良策略的數目,比如“永遠合作”。

雖然嚴格來說,“針鋒相對”并不是一個真正的進化穩定策略,但在實際操作中,將這一類基本善意又寬容、與“針鋒相對”類似的策略近似看做進化穩定策略,也是可行的。這一類策略里甚至可以包括一小部分惡意策略。阿克塞爾羅德的研究后繼有人,羅伯特·博伊德與杰弗里·洛伯鮑姆則是在這些后續研究者中得出最為有趣的成果。他們將“兩報還一報”與另一個“針鋒相對多疑版”(Suspicious Tit for Tat)的策略組合到一塊兒。“針鋒相對多疑版”近似于“針鋒相對”,但本質上是一個惡意策略,雖然惡意程度不高。它只在第一回合采取“背叛”行動,之后的所有出牌與“針鋒相對”完全相同。在一個“針鋒相對”占主要地位的環境中,“針鋒相對多疑版”并不走運,因為它的先行背叛導致了系列互相背叛的惡性循環。但當它遇上了“兩報還一報”時,這場冤冤相報則由對方的慈愛寬恕而化解了,雙方都能至少得到滿分,而“針鋒相對多疑版”還會因為其最初的背叛而獲得更高的分數。博伊德和洛伯鮑姆的結果表明,“針鋒相對”的群體可以被“兩報還一報”與“針鋒相對多疑版”的組合入侵影響。從進化論角度上說,則是“兩報還一報”與“針鋒相對多疑版”共生繁榮,進而影響了“針鋒相對”的種群。這種組合幾乎可以肯定不會消亡,而是以這種方式入侵相對穩定的種群。事實上,也許還有很多其他由稍微惡意與極度圣潔策略的組合可以入侵種群。有人也許可以從這里看到人類生活的對照。

阿克塞爾羅德意識到“針鋒相對”并不是嚴格意義上的進化穩定策略。他于是又創造了一個術語:集體穩定策略。由于在真正的進化穩定策略中,可以有不止一個策略同時達成集體穩定。另一方面,決定一個策略是否可以控制種群,更取決于其運氣。“永遠背叛”的策略也可以和“針鋒相對”一樣穩定。在一個被“永遠背叛”控制了的種群中,沒有任何其他策略可以取勝。我們也可以將這種系統稱為“雙穩態”,而將“永遠背叛”作為其中一個穩定點,“針鋒相對”(或者其他最善良寬容策略的組合)為另一個穩定點。無論哪一方首先在種群中達到數量優勢,則將繼續保持穩定。

然而,這個數量優勢如何量化?一個群體中,究竟需要多少“針鋒相對”來保證其戰勝“永遠背叛”?這取決于銀行家愿意在這場博弈中付出的具體數額。我們可以將此概括為一個決勝點。如果“針鋒相對”可以超過這個決勝點,自然選擇便會愈加偏愛“針鋒相對”。另一方面,如果“永遠背叛”超出了這個決勝點,自然選擇則會更加偏愛它。你也許還記得,我們在第十章中斤斤計較者與騙子的故事里,也曾與這個決勝點相遇過。

·落·霞·小·說 ?? w w w_l uo x ia_c o m

于是,獲勝的關鍵顯然取決于哪一方首先超過決勝點。而且我們還需要知道,有時主導種群還會變化,從一方變成另一方。我們假設現有的種群已經由“永遠背叛”作為主導了。少數派的“針鋒相對”難以互相碰面從而得到共享利益。自然選擇于是將該種群推向了“永遠背叛”的極致。只有該種群通過隨機轉換,使主導的一方變為“針鋒相對”,它才能繼續推進“針鋒相對”的發展,使得所有人都能從銀行家(或者自然)處得到利益。然而,種群沒有集體意愿,也沒有集體意識或目的。他們不能控制發展走向。主導方的轉換只能發生在自然界間接力量的作用下。

這種情況如何發生呢?一種回答是“運氣”。但這個單詞只能顯示無知。它表示“由一些尚未知道、未能分辨的方式來決定”。我們可以比“運氣”做得更好一些。我們可以想象少數派的“針鋒相對”個體如何從一個實際方法來增加其關鍵數目,探索“針鋒相對”個體如何集合成足夠的數量,使它們都可以從銀行家處得到回報。

這種想法貌似可行,但實際上機會渺茫。這些相似的個體如何在一個小范圍內集合到一起?在自然界中,最明顯的方式是由基因關系——親屬而集合。大多數動物喜歡同自己的兄弟姐妹與表親們,而不是種群中其他成員居住在一起。這并不一定是出于選擇,而是自動跟隨種群中的“黏性”。這里的“黏性”指的是任何使個體持續居住于出生地的趨勢。比如在人類歷史上,大部分地區的人們都只居住在出生地以外幾英里的地方(雖然現代社會已經不再如此)。因此,親屬的小團體們逐漸形成。我曾經到訪過愛爾蘭西海岸一個偏遠的島,令我吃驚的是,那里幾乎所有人都擁有巨大的耳朵。其中的原因很難解釋為大耳朵適應當地天氣(那里岸邊的風特別大)。這只能是因為島上大多數居民都是親緣相近的親屬。

基因相近的親屬們不僅在面部特征上相似,其他方面也有相近之處。比如,他們會因其基因趨勢而互相模仿著采用(或不采用)“針鋒相對”。于是,即使“針鋒相對”在種群整體里已經稀少,它依然可能在局部中廣泛使用。在這個小圈子里,“針鋒相對”的個體可以互相博弈,采取互相合作的方式來達到數目繁榮,即使在總體計算里它們依然處于弱勢地位。由此,最初僅占領小片地區的“針鋒相對”個體,將隨著小團體的逐漸擴大,逐漸向其他地區分散,甚至包括“永遠背叛”群體占主導的地區。如果用區域地理的方式思考,我舉的愛爾蘭島的例子則有些誤導,因為那里的人們被自然地理隔絕了。想象另一個例子:一個遷移不多的人群中,即使這片地區的人們已經有了廣泛持續的親緣關系,所有人也只復制近鄰(而不是遠鄰)的行為。

回頭看看,“針鋒相對”是可以超越決勝點的,它所需的只是這些個體的聚合,這一點在自然選擇里可以很自然地發生。這個與生俱來的優點使得“針鋒相對”即使在數目稀少的時候,還可以成功跨越決勝點而獲得成功。但這個跨越只是單向的。“永遠背叛”作為一個真正的進化穩定策略,并不可以使用個體聚合來跨越決勝點。相反的是,“永遠背叛”個體的聚合,不僅不能彼此互助而獲得群體繁榮,還會使各自的生存環境更加惡劣。它們無法暗自幫助對方獲得銀行家的獎賞,而只能把對方也拖下水。于是與“針鋒相對”相反,“永遠背叛”從親屬或種群聚合中得不到任何幫助。

所以,即使“針鋒相對”并非真正的進化穩定策略,它卻擁有更高的穩定性。這意味著什么?如果我們采用長遠的目光來看,“永遠背叛”可以在相當長一段時間內抵制其他策略的影響,但如果我們等上很長一段時間,也許是幾千年后,“針鋒相對”將最終聚集到足夠的數目,跨越決勝點,其數量終將反彈。而反方向的發展并不可能,“永遠背叛”無法在個體聚集中獲得好處,因此也無法得到這種更高的穩定性。

 

發表評論

山东快乐扑克3开奖结果