《博弈论的诡计：日常生活中的博弈策略》向合作进化的棘轮_博弈论的诡计：日常生活中的博弈策略全本免费在线阅读

一报还一报的策略在静态的群体中得到了很好的表现，那么，在一个动态的进化的群体中，这种合作能否产生、发展和生存下去呢？群体是会向合作的方向进化，还是向不合作的方向进化？如果大家开始都不合作，能否在进化过程中产生合作呢？

为了回答这些疑问，爱克斯罗德用生态学的原理来分析合作的进化过程。他假设对局者所组成的策略群体是一代一代进化下去的，进化的规则包括：

(1) 试错。人们在对待周围环境时，起初不知道该怎么做，于是就试试这个，试试那个，哪个结果好就照哪个去做。

(2) 遗传。一个人如果合作性好，他的后代的合作基因就多。

(3) 学习。比赛过程就是对手相互学习的过程，一报还一报的策略好，有人愿意学。

按这样的思路，爱克斯罗德设计了一个实验，假设63个参与者中，谁在第一轮中的得分髙，他在第二轮的群体中所占比例就相应增加。这样，群体的结构就会在进化过程中改变，由此可以看出群体是向什么方向进化的。

实验结果很有趣。一报还一报原来在群体中占1/63,经过1000代的进化，结构稳定下来时，它占了24%。因此，以合作系数来测量，群体是越来越合作的。这个结论还可以引申为：共同演化会使一报还一报的合作风格在这个充满背信弃义的世界上蔚然成风。

另外，有一些程序在进化过程中消失了。其中有一个值得研究的程序，即原来前15名中唯一的不善良的哈灵顿程序，它的对策方案是：首先合作，当发现对方一直在合作，它就突然来个不合作；如果对方立刻报复它，它就恢复合作，如果对方仍然合作，它就继续背叛。这个程序一开始发展很快，但等到与一报还一报不同的程序开始消失时，它就开始下降了。

由此，爱克斯罗德的试验除了表明群体是越来越合作的之外，还揭示了一个哲理：一个策略的成功应该以对方的成功为基础。

—报还一报在两个人对局时，得分不可能超过对方，最多打个平手，但它的总分最高。它赖以生存的基础是很牢固的，因为它让对方得到了髙分。哈灵顿程序就不是这样，它得到高分时，对方必然得到低分。它的成功是建立在别人失败的基础上的，而失败者总是要被淘汰的，当失败者被淘汰之后，这个从失败者身上占便宜的成功者也被淘汰。

即使在一个极端自私者所组成的不合作者的群体中，一报还一报也能够生存。

实际上，我们从逻辑上也可以理解这一点。假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。那么，只要这些个体能互相遇见，足够在今后的相逢中形成利害关系，他们就会开始形成小型的合作关系。

一旦发生了这种情况，他们就能远胜于周围的那些准备主动背叛的类型。这样，参与合作的人数就会增多。很快，一报还一报式的合作就会最终占上风。而一旦建立了这种机制，相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意，一报还一报策略强硬的一面就会狠狠地惩罚他们，让他们无法扩散影响。

爱克斯罗德发现，只要群体的5%或更多成员是一报还一报的，这些合作者就能生存；而且，只要他们的得分超过群体的总平均分，这个合作的群体就会越来越大，最后蔓延到整个群体。相反，不合作者无论在一个合作者占多数的群体中有多大比例，都是不可能越来越多的。

这就说明，社会向合作进化的棘轮是不可逆转的，群体的合作性会越来越大。爱克斯罗德正是以这样一个鼓舞人心的结论，为人类突破囚徒困境指出了一条道路。