什么是重复囚徒困境?
迭代囚徒困境是一般形式的延伸,只不过博弈是由相同的参与者重复进行的。迭代囚徒困境与囚徒困境的原始概念不同,因为参与者可以了解对方的行为倾向。
反复出现的囚徒困境有时被称为和平战争游戏。
理解重复的囚徒困境
由于游戏是重复的,一个人可以制定一种不遵循孤立回合常规逻辑惯例的策略。以牙还牙是一种常见的迭代囚徒困境策略。
重复的囚徒困境博弈是许多人类合作和信任理论的基础。基于游戏可以对需要信任的两个人之间的交易进行建模的假设,群体中的合作行为可以通过游戏的多人迭代版本来建模。
多年来,游戏背后的理论吸引了许多学者。最近,组织设计研究人员使用该游戏来模拟企业战略。随着博弈论在投资策略师中的流行,囚徒困境现在也变得司空见惯。全球化和一体化贸易进一步推动了对能够描述地缘政治问题的金融和运营模型的需求。
迭代囚徒困境博弈示例
例如,您和一位同事因涉嫌犯罪而入狱。你们彼此孤立,不知道对方会如何回应询问。警方邀请你们俩互相牵连对方的犯罪行为(缺陷)。发生什么取决于你们俩做什么,但你们都不知道对方会如何反应。
如果你的同事背叛了你(屈服于背叛的诱惑),而你保持沉默,那么你会受到最长的监禁,而你的同事却逍遥法外(反之亦然)。如果你们都选择通过保持沉默来配合对方(而不是警察),则没有足够的证据对你们两人定罪,所以你们都会以较轻的罪名被轻判。如果你们俩都决定叛逃,那么你们就已经对彼此判处了稍微减轻但仍然很重的刑罚。
这个游戏的回报是减少非常好、相当好、相当差或非常差的监狱量刑,转化为如下的评分系统:
游戏会反复进行多轮,直到结束(就好像您因不同的罪行而被反复审讯一样)。每轮的分数都会累积,因此目标是在游戏结束之前优化分数。游戏结束是在 1 到 100 轮之间随机确定的。游戏结束时,分数将转换为最佳分数的百分比。