什麼是重複囚徒困境?
迭代囚徒困境是一般形式的延伸,只不過博弈是由相同的參與者重複進行的。迭代囚徒困境與囚徒困境的原始概念不同,因爲參與者可以瞭解對方的行爲傾向。
反覆出現的囚徒困境有時被稱爲和平戰爭遊戲。
理解重複的囚徒困境
由於遊戲是重複的,一個人可以制定一種不遵循孤立回合常規邏輯慣例的策略。以牙還牙是一種常見的迭代囚徒困境策略。
重複的囚徒困境博弈是許多人類合作和信任理論的基礎。基於遊戲可以對需要信任的兩個人之間的交易進行建模的假設,羣體中的合作行爲可以通過遊戲的多人迭代版本來建模。
多年來,遊戲背後的理論吸引了許多學者。最近,組織設計研究人員使用該遊戲來模擬企業戰略。隨着博弈論在投資策略師中的流行,囚徒困境現在也變得司空見慣。全球化和一體化貿易進一步推動了對能夠描述地緣政治問題的金融和運營模型的需求。
迭代囚徒困境博弈示例
例如,您和一位同事因涉嫌犯罪而入獄。你們彼此孤立,不知道對方會如何回應詢問。警方邀請你們倆互相牽連對方的犯罪行爲(缺陷)。發生什麼取決於你們倆做什麼,但你們都不知道對方會如何反應。
如果你的同事背叛了你(屈服於背叛的誘惑),而你保持沉默,那麼你會受到最長的監禁,而你的同事卻逍遙法外(反之亦然)。如果你們都選擇通過保持沉默來配合對方(而不是警察),則沒有足夠的證據對你們兩人定罪,所以你們都會以較輕的罪名被輕判。如果你們倆都決定叛逃,那麼你們就已經對彼此判處了稍微減輕但仍然很重的刑罰。
這個遊戲的回報是減少非常好、相當好、相當差或非常差的監獄量刑,轉化爲如下的評分系統:
遊戲會反覆進行多輪,直到結束(就好像您因不同的罪行而被反覆審訊一樣)。每輪的分數都會累積,因此目標是在遊戲結束之前優化分數。遊戲結束是在 1 到 100 輪之間隨機確定的。遊戲結束時,分數將轉換爲最佳分數的百分比。