以下引用自:[英] 理查德·道金斯著.自私的基因(40周年增订版).中信出版集团.2018:14.
第12章好人终有好报(节选)
“囚徒”来自一个特殊的、想象中的例子,上述例子中的现金被监狱的刑罚取代。两个在监狱中的囚徒——姑且称他们为彼得森与莫里亚蒂,有共同犯罪的嫌疑。囚徒们各自被关押在单独的牢房里,并各自被劝诱背叛他的同伙,将所有犯罪证据栽赃对方。他们的判决结果将取决于两个囚徒的行为,而双方都不知道对方的选择。如果彼得森将所有罪过都推向莫里亚蒂,而莫里亚蒂始终保持沉默(与他从前的朋友、现在的叛徒合作),莫里亚蒂将接受重罚,而彼得森得以无罪释放,享受背叛的诱惑。如果两人互相背叛,便都将获罪,但可以因为供认不讳而得到轻判,这便是互相背叛的惩罚。如果两人互相与对方而不是当局合作,闭口不谈过往,所得证据将不足以把两人判以重罪,则两人也都将得到轻判,得到互相合作的奖赏。虽然将牢狱刑罚称为“奖赏”有点儿奇怪,但比起漫长的铁窗生涯,犯人们肯定会将此看作奖赏的。你可以发现,虽然这里的回报不是美元而是牢狱刑罚,博弈的主要特征依然保存着(看看四个结果可取性的排列顺序)。如果你将自己放在任何一个囚徒的位置上,假设两人都以理性的自我利益为动机,你将看到两人都只能背叛对方,而同样接受沉重的刑罚。
有没有逃离困境的方法呢?双方都知道,无论对方如何选择,他们能做出的最好的选择都是“背叛”。但他们也都知道,如果双方都选择合作,任何一方都可以得到更多的好处。如果……如果……如果能有一个办法让他们达成共识,能有一个办法让双方都坚信对方可以被信任,不至于奔向那个自私的奖赏,能有一个方法来维持双方共识……