博弈論的詭計：日常生活中的博弈策略：向合作進化的棘輪_王春永

一報還一報的策略在靜態的群體中得到了很好的表現，那麼，在一個動態的進化的群體中，這種合作能否產生、發展和生存下去呢？群體是會向合作的方向進化，還是向不合作的方向進化？如果大家開始都不合作，能否在進化過程中產生合作呢？

為了回答這些疑問，愛克斯羅德用生態學的原理來分析合作的進化過程。他假設對局者所組成的策略群體是一代一代進化下去的，進化的規則包括：

(1) 試錯。人們在對待周圍環境時，起初不知道該怎麼做，於是就試試這個，試試那個，哪個結果好就照哪個去做。

(2) 遺傳。一個人如果合作性好，他的後代的合作基因就多。

(3) 學習。比賽過程就是對手相互學習的過程，一報還一報的策略好，有人願意學。

按這樣的思路，愛克斯羅德設計了一個實驗，假設63個參與者中，誰在第一輪中的得分高，他在第二輪的群體中所佔比例就相應增加。這樣，群體的結構就會在進化過程中改變，由此可以看出群體是向什麼方向進化的。

實驗結果很有趣。一報還一報原來在群體中占1/63,經過1000代的進化，結構穩定下來時，它佔了24%。因此，以合作係數來測量，群體是越來越合作的。這個結論還可以引申為：共同演化會使一報還一報的合作風格在這個充滿背信棄義的世界上蔚然成風。

另外，有一些程序在進化過程中消失了。其中有一個值得研究的程序，即原來前15名中唯一的不善良的哈靈頓程序，它的對策方案是：首先合作，當發現對方一直在合作，它就突然來個不合作；如果對方立刻報復它，它就恢復合作，如果對方仍然合作，它就繼續背叛。這個程序一開始發展很快，但等到與一報還一報不同的程序開始消失時，它就開始下降了。

由此，愛克斯羅德的試驗除了表明群體是越來越合作的之外，還揭示了一個哲理：一個策略的成功應該以對方的成功為基礎。

—報還一報在兩個人對局時，得分不可能超過對方，最多打個平手，但它的總分最高。它賴以生存的基礎是很牢固的，因為它讓對方得到了高分。哈靈頓程序就不是這樣，它得到高分時，對方必然得到低分。它的成功是建立在別人失敗的基礎上的，而失敗者總是要被淘汰的，當失敗者被淘汰之後，這個從失敗者身上佔便宜的成功者也被淘汰。

即使在一個極端自私者所組成的不合作者的群體中，一報還一報也能夠生存。

實際上，我們從邏輯上也可以理解這一點。假設少數採取一報還一報策略的個人在這個世界上通過突變而產生了。那麼，只要這些個體能互相遇見，足夠在今後的相逢中形成利害關係，他們就會開始形成小型的合作關係。

一旦發生了這種情況，他們就能遠勝於周圍的那些準備主動背叛的類型。這樣，參與合作的人數就會增多。很快，一報還一報式的合作就會最終佔上風。而一旦建立了這種機制，相互合作的個體就能生存下去。如果不太合作的類型想侵犯和利用他們的善意，一報還一報策略強硬的一面就會狠狠地懲罰他們，讓他們無法擴散影響。

愛克斯羅德發現，只要群體的5%或更多成員是一報還一報的，這些合作者就能生存；而且，只要他們的得分超過群體的總平均分，這個合作的群體就會越來越大，最後蔓延到整個群體。相反，不合作者無論在一個合作者佔多數的群體中有多大比例，都是不可能越來越多的。

這就說明，社會向合作進化的棘輪是不可逆轉的，群體的合作性會越來越大。愛克斯羅德正是以這樣一個鼓舞人心的結論，為人類突破囚徒困境指出了一條道路。