囚徒困境—— 收益矩阵 | 嫌疑人乙 | ||
合作 | 缺点 | ||
嫌疑人A | 合作 | (一)-1,-1 | (c)-3, 0 |
缺点 | (b) 0, -3 | (d) -2, -2 |
玩家的占优策略是一种能够为该玩家带来最佳收益的策略,而不管其他玩家采用的策略如何。这里的主导策略是每个玩家叛逃(即坦白),因为坦白可以最大限度地减少平均入狱时间。以下是可能的结果:
- 如果 A 和 B 合作并保持沉默,两人都会被判入狱一年——如牢房 (a) 所示。
- 如果 A 认罪但 B 不认罪,则 A 被释放,B 被判三年有期徒刑——如牢房 (b) 所示。
- 如果 A 不认罪,但 B 认罪,A 被判三年徒刑,B 被释放——参见单元格 (c)。
- 如果 A 和 B 都坦白,两人都会被判入狱两年——如牢房 (d) 所示。
因此,如果 A 认罪,他们要么获释,要么入狱两年。但如果他们不认罪,他们要么被判一年或三年监禁。 B面临着完全相同的困境。显然,最好的策略是坦白,无论其他嫌疑人做了什么。
囚徒困境的影响
囚徒困境巧妙地表明,当每个人都追求自己的私利时,结果会比双方合作更糟糕。在上面的例子中,合作——A和B都保持沉默且不招供——将使两名嫌疑人总共被判处两年监禁。所有其他结果将导致三年或四年中的两年的合并判决。
事实上,一个只关心自己利益最大化的理性人通常会选择背叛,而不是合作。如果双方都选择叛逃,假设对方不会,那么他们最终不会像他们每个人所希望的那样进入单元格 (b) 或 (c) 选项,而是最终进入单元格 (d) 位置,并且每个人都会获得 2入狱多年。
在囚犯的例子中,与另一名嫌疑人合作不可避免地会被判处一年徒刑,而坦白在最好的情况下会被释放,最坏的情况下会被判处两年徒刑。然而,如果A相信B也保持沉默的信心被证明是错误的,而B实际上坦白了(反之亦然),那么不坦白就有可能被判处最高三年徒刑。
尽管合作可能产生最佳结果,但背叛(不合作)的动机却如此强烈,这种困境在商业和经济中以多种方式表现出来
1950 年,阿尔伯特·塔克 (Albert Tucker) 首次向斯坦福大学的一群心理学研究生提出了囚徒困境,作为博弈论的一个例子。
商业应用
现实世界中囚徒困境的一个典型例子是当两个竞争对手在市场上展开较量时遇到的。通常,许多经济部门都有两个主要竞争对手。例如,在美国,可口可乐 ( KO ) 和百事可乐 ( PEP ) 在软饮料领域展开激烈竞争,家得宝 ( HD ) 与劳氏 ( LOW ) 在建筑用品领域展开激烈竞争。该竞赛在商学院引发了大量案例研究。其他激烈的竞争包括加拿大星巴克 ( SBUX ) 与蒂姆霍顿 ( THI ) 的竞争,以及全球手机领域苹果 ( AAPL ) 与三星的竞争。
考虑可口可乐与百事可乐的案例,并假设前者正在考虑降低其标志性汽水的价格。如果这样做,百事可乐可能别无选择,只能效仿其可乐以保住其市场份额。这可能会导致两家公司的利润大幅下降。
因此,任何一家公司的价格下降都可能被视为背叛,因为它违反了保持高价格和利润最大化的隐含协议。因此,如果可口可乐降低价格,但百事可乐继续保持高价格,则前者是背叛,而后者是合作(通过坚持默示协议的精神)。在这种情况下,可口可乐可能会通过销售更多的可乐来赢得市场份额并赚取增量利润。
收益矩阵
假设可口可乐和百事可乐的增量利润如下:
- 如果两者都保持高价格,则每家公司的利润将增加 5 亿美元(因为需求的正常增长)。
- 如果其中一方降价(即缺陷),而另一方不降价(即合作),则前者的利润会因更大的市场份额而增加 7.5 亿美元,而后者的利润则保持不变。
- 如果两家公司都降低价格,软饮料消费量的增加将抵消价格的下降,每家公司的利润将增加 2.5 亿美元。
收益矩阵如下所示(数字代表增量利润,以亿计):
可口可乐与百事可乐 – 收益矩阵 | 百事可乐 | ||
合作 | 缺点 | ||
可口可乐 | 合作 | 500, 500 | 0, 750 |
缺点 | 750, 0 | 250, 250 |
其他经常被引用的囚徒困境例子包括新产品或技术开发或公司的广告和营销支出等领域。
例如,如果两家公司隐含协议在某一年保持广告预算不变,那么它们的净利润可能会保持在相对较高的水平。但如果一家公司出现缺陷并提高其广告预算,它可能会以牺牲另一家公司的利益为代价获得更大的利润,因为更高的销售额抵消了增加的广告费用。然而,如果两家公司都增加广告预算,那么增加的广告力度可能会相互抵消并被证明是无效的,从而导致利润较低(由于广告费用较高),而广告预算保持不变的情况会出现这种情况。
经济应用
时不时出现的美国民主党和共和党之间的债务僵局就是囚徒困境的典型例子。
假设解决美国债务问题的效用或好处将是各党派在下次选举中的选举收益。这里的合作是指双方愿意努力维持美国不断上升的预算赤字的现状。背叛意味着放弃这一隐含的协议,并采取必要的措施控制赤字。
如果双方合作并保持经济平稳运行,一些选举收益是有保证的。但如果甲方试图主动解决债务问题,而乙方不配合,这种顽抗可能会让B方在下次选举中失去选票,而这些选票可能会流向A方。
然而,如果双方在解决债务问题时放弃合作并采取强硬态度,那么随之而来的经济动荡(市场下滑、可能的信用评级下调以及政府关门)可能会导致双方的选举收益下降。
您如何使用它?
囚徒困境可以用来帮助个人生活中许多领域的决策,例如购买汽车、薪资谈判等。
例如,假设您正在市场上购买一辆新车,并且走进了一家汽车经销店。在这种情况下,效用或回报是非数字属性(即对交易的满意度)。您希望在价格、汽车功能等方面获得尽可能最好的交易,而汽车销售员则希望获得尽可能高的价格以最大化他的佣金。
在这种情况下,合作意味着不讨价还价;你走进去,支付标价(这让推销员很高兴),然后开着一辆新车离开。另一方面,叛逃意味着讨价还价。你想要更低的价格,而推销员想要更高的价格。用数值表示满意度,其中 10 表示对交易完全满意,0 表示不满意,支付矩阵如下所示:
汽车买家与推销员 – 收益矩阵 | 推销员 | ||
合作 | 缺点 | ||
买方 | 合作 | (一) 7, 7 | (c) 0,10 |
缺点 | (b) 10, 0 | (d) 3, 3 |
这个矩阵告诉我们什么?如果你进行了艰苦的讨价还价并获得了汽车价格的大幅降低,那么你可能对这笔交易完全满意,但推销员可能会因为佣金的损失而不满意(如单元格b所示) 。
相反,如果推销员坚持己见,在价格上不让步,你可能对交易不满意,而推销员却完全满意(单元格 c)。
如果您只是走进去并支付全额标价(单元格 a),您的满意度可能会降低。在这种情况下,推销员也可能不太满意,因为你愿意支付全价可能会让他想知道他是否可以“引导”你购买更昂贵的型号,或者添加更多花哨的东西以获得更多佣金。
单元格(d)显示买卖双方的满意度要低得多,因为长时间的讨价还价可能最终导致在汽车价格上勉强妥协。
同样,在薪资谈判中,您可能不明智地接受潜在雇主向您提供的第一个报价(假设您知道自己更有价值)。
在困难的就业市场上,通过接受第一份工作来进行合作似乎是一个简单的解决方案,但它可能会导致你留下一些钱。为了更高的薪水而背叛(即谈判)确实可能会给你带来更丰厚的薪水。相反,如果雇主不愿意支付更多费用,你可能会对最终的报价不满意。
希望薪资谈判不会变得激烈,因为这可能会导致您和雇主的满意度降低。前面显示的买方-销售员支付矩阵可以很容易地扩展,以显示求职者与雇主的满意度。
囚徒困境的例子是什么?
这种“交换博弈”与囚徒困境具有相同的结构,并表明了合作的好处。格雷格 (Greg) 有一顶绿色帽子,更喜欢蓝色帽子,而布伦达 (Brenda) 有一顶蓝色帽子,更喜欢绿色帽子。两者都宁愿有两个上限,也不愿只有一个上限,也宁愿有任何一个上限,也不愿根本没有上限。他们每个人都可以选择保留自己拥有的帽子还是将其送给对方。无论罗斯保留她的帽子还是把它送给比尔,比尔最好保留他的帽子,如果他把帽子送给她,她的情况也会更好。无论比尔保留他的帽子还是把它送给罗斯,罗斯最好保留她的帽子,如果她把帽子送给他,他的情况也会更好。理想的情况是拥有两顶帽子,但这只有在一个人行为自私的情况下才有可能实现——这意味着一个人没有帽子。然而,如果他们交换帽子,比只保留现有的帽子更好,因为这将是他们更喜欢的颜色。
囚徒困境中的主导策略是什么?
在囚徒困境中,两名嫌疑人(我们称他们为赫伯和李)都不知道另一名嫌疑人做出的决定。赫伯害怕保持沉默,因为在这种情况下,如果李指责他,他可能会被判处更多年徒刑。如果赫伯选择责怪李,只要李保持沉默,他就可以被释放。然而,这不太可能,因为李用同样的理由,她也会责怪赫伯。
因此,两名嫌疑人保持沉默的决定(信任与合作的最终结果)提供了更佳的回报(每个人的入狱时间更少)。但这并不是一个真正理性的选择,因为双方都必然会为了自己的利益而行动,并指责对方,以免浪费时间。因此,第二好的策略是让两名嫌疑人都坦白。与两人都保持沉默相比,每一个人都会被判更多的刑期,但比一个人保持沉默而一个人招供的刑期要少。
如何克服囚徒困境?
随着时间的推移,人们针对囚徒困境制定了各种解决方案,以克服个人动机而有利于共同利益。在现实世界中,大多数经济和其他人类互动都会重复不止一次。真正的囚徒困境通常只玩一次;通过重复,人们可以开始预测他人的行为,并从错误和不利结果中学习。
人们已经制定了正式的制度策略来改变个人决策者面临的激励。通过声誉、规则、法律、民主或其他集体决策以及对叛逃的明确社会惩罚来强制执行合作行为的集体行动,将许多囚徒困境转变为对集体有利的合作结果。
此外,随着时间的推移,一些人和群体会产生心理和行为偏见,例如彼此之间更高的信任度,在反复互动中对未来的长期导向,以及倾向于合作行为的正互惠或背叛行为的负互惠。随着时间的推移,这些趋势可能会通过社会内的自然选择或不同竞争社会之间的群体选择而演变。实际上,它们导致一群人“非理性”地选择实际上对他们所有人最有利的结果。
公地悲剧是经济中囚徒困境的一个典型例子。保护公共自然资源并对其繁殖进行再投资,以便能够继续消耗它,可能符合每个人的集体利益,但每个人总是有动力尽快消耗尽可能多的资源,这然后耗尽资源。
结论
囚徒困境告诉我们,单纯的合作并不总是符合一个人的最大利益。事实上,当购买汽车等大件商品时,从消费者的角度来看,讨价还价是首选的行为方式。否则,汽车经销商可能会在价格谈判中采取不灵活的政策,以实现利润最大化,但导致消费者为车辆支付过高的费用。
了解合作与背叛的相对回报可能会刺激您在进行大笔购买之前进行重要的价格谈判。