囚犯的困境是什么?
囚犯的困境是一个悖论决策分析其中两个以自己的自身利益行事的人不会产生最佳结果。
囚犯的困境是游戏理论的主要例子,是由兰德公司数学家Merrill Flood和Melvin Dresher在冷战期间开发的(但后来以游戏理论家Alvin Tucker的名字命名)。一些人推测,在冷战期间,囚犯的困境是为了模拟美国和苏联之间的战略思想。
如今,囚犯的困境是一个范式的例子,说明个人之间的战略思维如何导致两位球员的次优结果。
关键要点
- 囚犯的困境是一种情况下,个人决策者总是有动力以一种为个人而言所造成的不足以最佳结果的方式。
- 囚犯的困境发生在经济的许多方面。
- 在经典的囚犯困境中,如果他们背叛了团体而不是合作,他们就会获得最大的回报。
- 如果重复游戏,每个玩家都可以设计一种奖励合作的策略。
- 人们开发了许多克服囚犯困境的方法,以选择更好的集体成果,尽管显然是不利的激励措施。
Investopedia / Laura Porter
了解囚犯的困境
典型的囚犯的困境的建立方式使双方选择以其他参与者为代价保护自己。结果,两个参与者都发现自己处于更糟糕的状态,而他们在决策过程中彼此合作。囚犯的困境是现代最著名的概念之一游戏理论。
囚犯的困境提出了一个情况,即两个政党分开且无法交流,各自都必须在与对方合作之间进行选择。当双方选择合作时,每一方的最高奖励。
经典囚犯的困境是这样的:
- 两名银行抢劫犯伊丽莎白和亨利已被捕,并在单独的房间中受到讯问。
- 当局没有其他证人,只有能够说服至少一名强盗背叛他们的同伙并向犯罪作证,才能证明对他们的案件。
- 每个银行强盗都面临着与同伙合作,保持沉默或从帮派中叛逃并作证起诉的选择。
- 如果他们俩都合作并保持沉默,那么当局只能以较少的指控定罪,导致每年入狱一年(Elizabeth + 1年 +亨利1年=亨利= 2年总计监禁)。
- 如果一个人作证,另一个人没有作证,那么一个证明的人将获得免费,另一个人将获得五年的时间(对于一个被定罪的一个缺陷 + 5的人为0年,总计= 5年)。
- 但是,如果两者都作证对方,则每个人都因抢劫部分负责(伊丽莎白 + 3年亨利的3年= 6年的6年总狱时间),每个人都将入狱三年。
各自的罚款可以在视觉上如下表示:
囚犯困境的可能结果 | ||
---|---|---|
结果 | 亨利·库特拉特 | 亨利缺陷 |
伊丽莎白合作 | (1,1) | (5,0) |
伊丽莎白缺陷 | (0,5) | (3,3) |
在这种情况下,无论对方做出什么选择,每个强盗始终都有诱因缺陷。从伊丽莎白的角度来看,如果亨利保持沉默,那么伊丽莎白可以与亨利合作,并在监狱中进行一年的监狱,或者缺陷并自由。显然,在这种情况下,她会更好地背叛亨利。另一方面,如果亨利(Henry)缺陷并作证了伊丽莎白(Elizabeth),那么她的选择将保持沉默,做五年,或者交谈并在监狱中进行三年。再次,显然,她更喜欢在五年内完成三年。
在这两种情况下,亨利是与伊丽莎白合作还是针对起诉的缺陷,如果伊丽莎白有缺陷和作证,伊丽莎白都会更好。现在,由于亨利面临着完全相同的选择,他也总是会更好地出现叛逃。
囚犯困境的悖论是:两位强盗都可以最大程度地减少他们两个人合作和保持沉默的总入狱时间(总共两年),但是他们每个人分别遇到的激励措施总是会驱使他们各自的缺陷并最终在他们六年的总和中最大的总入狱时间。
重要的
囚犯的困境经常在经济学或业务解释为什么个人激励措施可能会导致演员选择亚最佳结果的情况。
囚犯困境的例子
经济充斥着囚犯困境的例子,这些困境可能会产生对整个经济和社会有益或有害的结果。共同点是:每种决策者所面临的激励措施会以一种使他们共同恶化的方式诱使他们的表现,同时单独避免选择,如果所有人可以合作地选择,都会使他们共同取得更好的状态。
一个这样的例子是下议院的悲剧。为了能够继续消费它,保存和重新投资的人可能会对每个人的集体优势进行繁殖和重新投资,但每个人总是有动机尽可能快地消费,然后消耗资源。寻找某种合作的方法显然会使每个人都变得更好。
另一方面,行为卡特尔也可以被视为囚犯的困境。卡特尔的所有成员都可以通过限制产出来集体丰富自己,以保持每个人获得的价格足够高以捕获消费者的经济租金,但是每个卡特尔成员都有动力来欺骗卡特尔并增加产出,从而使租金也从其他卡特尔成员那里捕获。就卡特尔(Cartel)运作的整体社会的福利而言,这是个人激励措施有时实际上可以使社会整体改善的一个例子。
逃离囚犯的困境
随着时间的流逝,人们为囚犯的困境制定了各种解决方案,以克服个人激励措施,以支持共同利益。
首先,在现实世界中,大多数经济和其他人类互动都会不止一次重复。真正的囚犯的困境通常仅一次进行一次迭代囚犯的困境。在迭代的囚犯困境中,玩家可以选择奖励合作或随着时间惩罚叛逃的策略。通过反复与同一个人互动,我们甚至可以故意从一次囚犯的困境转变为一再囚犯的困境。
其次,人们制定了正式的机构策略来改变个人决策者面临的激励措施。通过声誉,规则,法律,民主或其他集体决策程序来实施合作行为的集体行动以及对叛逃的明确惩罚将许多囚犯的困境转变为更加有益的合作成果。
最后,有些人和一群人随着时间的流逝发展了心理和行为偏见,例如彼此之间的更高信任,重复互动的长期未来取向,以及对合作行为的积极互惠或缺陷行为的负面互惠的倾向。这些趋势可能通过一种自然选择在社会中,随着时间的推移或跨不同竞争社会的群体选择。实际上,他们导致一群人“非理性地”选择实际上对所有人最有益的结果。
汇总了这三个因素(一再是囚犯的困境,打破囚犯困境的正式机构以及破坏囚犯困境中“理性”个人选择的行为偏见)有助于解决我们所有人都面对的许多囚犯的困境。
快速事实
在迭代的囚犯困境中,两位球员都可以制定一项惩罚背叛和奖励合作的策略。这 ”Tat的山雀“战略已被确定为优化囚犯困境的最佳方式。TAT是由Anatol Rapoport引入的,Anatol Rapoport提出了一项战略,在该战略中,每个参与者都在迭代囚犯的困境中遵循与对手的前一转的行动。例如,如果受到挑衅,球员随后会以报复作出回应。如果无主动,玩家会合作。
囚犯困境的可能结果是什么?
囚犯困境的可能结果是,两个球员的缺陷(即,自私地表现),导致两者的次优结果。这也是纳什平衡这是游戏理论中的决策定理,指出玩家可以通过不偏离初始策略来实现所需的结果。在此示例中,NASH的均衡是两个球员都背叛了一个,尽管相互合作为两个球员带来了更好的结果。但是,如果一个囚犯选择相互合作,而另一名囚犯则不会有一个囚犯的结果,则更糟。
打击囚犯困境的一些方法是什么?
囚犯困境的解决方案集中于克服个人激励措施,以支持共同利益。在现实世界中,大多数经济和其他人类互动都会不止一次重复。这使当事方可以选择奖励合作或随着时间惩罚叛逃的策略。
另一个解决方案依靠制定正式的机构策略来改变个人决策者面临的激励措施。最后,随着时间的流逝,行为偏见可能会发展出来,这会破坏囚犯困境中“理性”的个人选择,并导致个人“非理性”选择实际上对所有人最有益的结果。
囚犯的困境对社会有用吗?
囚犯的困境问题有时实际上会使社会整体改善。一个主要的例子是油卡特尔的行为。所有卡特尔成员都可以通过限制产出以使石油的价格保持在最大化消费者收入的水平来集体丰富自己,但是每个卡特尔成员都单独动机欺骗卡特尔并增加产出,也可以将收入从其他卡特尔成员中获取。最终结果不是卡特尔渴望的最佳结果,而是在较低的油价方面受益于消费者的结果。
公地的悲剧是什么?
公地的悲剧是经济学中的一个理论问题,它提出每个人都有动力消耗资源,但以其他每个人为代价 - 无法将任何人排除在消费之外。通常,没有障碍的所有个人都可以轻松获得感兴趣的资源(即“公共”)。从假设的角度来看,这会导致过度消费和最终耗尽共同资源,这是每个人的损害。基本上,它突出了个人在追求个人利益时忽略社会福祉的概念。它的准确性和应用是有争议的。
底线
囚犯的困境是难以解决集体行动问题的著名寓言。通过自己的自身利益行事,隐喻的囚犯发现自己的处罚比他们共同努力时面临的惩罚更大。但是,当长期重复实验时,玩家有可能为合作而设计激励措施。
更正 - 6月30日,2022年:编辑了囚犯困境的例子,以证明遵循个人利益如何导致最糟糕的结果。