囚徒困境—— 收益矩陣 | 嫌疑人乙 | ||
合作 | 缺點 | ||
嫌疑人A | 合作 | (一)-1,-1 | (c)-3, 0 |
缺點 | (b) 0, -3 | (d) -2, -2 |
玩家的佔優策略是一種能夠爲該玩家帶來最佳收益的策略,而不管其他玩家採用的策略如何。這裏的主導策略是每個玩家叛逃(即坦白),因爲坦白可以最大限度地減少平均入獄時間。以下是可能的結果:
- 如果 A 和 B 合作並保持沉默,兩人都會被判入獄一年——如牢房 (a) 所示。
- 如果 A 認罪但 B 不認罪,則 A 被釋放,B 被判三年有期徒刑——如牢房 (b) 所示。
- 如果 A 不認罪,但 B 認罪,A 被判三年徒刑,B 被釋放——參見單元格 (c)。
- 如果 A 和 B 都坦白,兩人都會被判入獄兩年——如牢房 (d) 所示。
因此,如果 A 認罪,他們要麼獲釋,要麼入獄兩年。但如果他們不認罪,他們要麼被判一年或三年監禁。 B面臨着完全相同的困境。顯然,最好的策略是坦白,無論其他嫌疑人做了什麼。
囚徒困境的影響
囚徒困境巧妙地表明,當每個人都追求自己的私利時,結果會比雙方合作更糟糕。在上面的例子中,合作——A和B都保持沉默且不招供——將使兩名嫌疑人總共被判處兩年監禁。所有其他結果將導致三年或四年中的兩年的合併判決。
事實上,一個只關心自己利益最大化的理性人通常會選擇背叛,而不是合作。如果雙方都選擇叛逃,假設對方不會,那麼他們最終不會像他們每個人所希望的那樣進入單元格 (b) 或 (c) 選項,而是最終進入單元格 (d) 位置,並且每個人都會獲得 2入獄多年。
在囚犯的例子中,與另一名嫌疑人合作不可避免地會被判處一年徒刑,而坦白在最好的情況下會被釋放,最壞的情況下會被判處兩年徒刑。然而,如果A相信B也保持沉默的信心被證明是錯誤的,而B實際上坦白了(反之亦然),那麼不坦白就有可能被判處最高三年徒刑。
儘管合作可能產生最佳結果,但背叛(不合作)的動機卻如此強烈,這種困境在商業和經濟中以多種方式表現出來
1950 年,阿爾伯特·塔克 (Albert Tucker) 首次向斯坦福大學的一羣心理學研究生提出了囚徒困境,作爲博弈論的一個例子。
商業應用
現實世界中囚徒困境的一個典型例子是當兩個競爭對手在市場上展開較量時遇到的。通常,許多經濟部門都有兩個主要競爭對手。例如,在美國,可口可樂 ( KO ) 和百事可樂 ( PEP ) 在軟飲料領域展開激烈競爭,家得寶 ( HD ) 與勞氏 ( LOW ) 在建築用品領域展開激烈競爭。該競賽在商學院引發了大量案例研究。其他激烈的競爭包括加拿大星巴克 ( SBUX ) 與蒂姆霍頓 ( THI ) 的競爭,以及全球手機領域蘋果 ( AAPL ) 與三星的競爭。
考慮可口可樂與百事可樂的案例,並假設前者正在考慮降低其標誌性汽水的價格。如果這樣做,百事可樂可能別無選擇,只能效仿其可樂以保住其市場份額。這可能會導致兩家公司的利潤大幅下降。
因此,任何一家公司的價格下降都可能被視爲背叛,因爲它違反了保持高價格和利潤最大化的隱含協議。因此,如果可口可樂降低價格,但百事可樂繼續保持高價格,則前者是背叛,而後者是合作(通過堅持默示協議的精神)。在這種情況下,可口可樂可能會通過銷售更多的可樂來贏得市場份額並賺取增量利潤。
收益矩陣
假設可口可樂和百事可樂的增量利潤如下:
- 如果兩者都保持高價格,則每家公司的利潤將增加 5 億美元(因爲需求的正常增長)。
- 如果其中一方降價(即缺陷),而另一方不降價(即合作),則前者的利潤會因更大的市場份額而增加 7.5 億美元,而後者的利潤則保持不變。
- 如果兩家公司都降低價格,軟飲料消費量的增加將抵消價格的下降,每家公司的利潤將增加 2.5 億美元。
收益矩陣如下所示(數字代表增量利潤,以億計):
可口可樂與百事可樂 – 收益矩陣 | 百事可樂 | ||
合作 | 缺點 | ||
可口可樂 | 合作 | 500, 500 | 0, 750 |
缺點 | 750, 0 | 250, 250 |
其他經常被引用的囚徒困境例子包括新產品或技術開發或公司的廣告和營銷支出等領域。
例如,如果兩家公司隱含協議在某一年保持廣告預算不變,那麼它們的淨利潤可能會保持在相對較高的水平。但如果一家公司出現缺陷並提高其廣告預算,它可能會以犧牲另一家公司的利益爲代價獲得更大的利潤,因爲更高的銷售額抵消了增加的廣告費用。然而,如果兩家公司都增加廣告預算,那麼增加的廣告力度可能會相互抵消並被證明是無效的,從而導致利潤較低(由於廣告費用較高),而廣告預算保持不變的情況會出現這種情況。
經濟應用
時不時出現的美國民主黨和共和黨之間的債務僵局就是囚徒困境的典型例子。
假設解決美國債務問題的效用或好處將是各黨派在下次選舉中的選舉收益。這裏的合作是指雙方願意努力維持美國不斷上升的預算赤字的現狀。背叛意味着放棄這一隱含的協議,並採取必要的措施控制赤字。
如果雙方合作並保持經濟平穩運行,一些選舉收益是有保證的。但如果甲方試圖主動解決債務問題,而乙方不配合,這種頑抗可能會讓B方在下次選舉中失去選票,而這些選票可能會流向A方。
然而,如果雙方在解決債務問題時放棄合作並採取強硬態度,那麼隨之而來的經濟動盪(市場下滑、可能的信用評級下調以及政府關門)可能會導致雙方的選舉收益下降。
您如何使用它?
囚徒困境可以用來幫助個人生活中許多領域的決策,例如購買汽車、薪資談判等。
例如,假設您正在市場上購買一輛新車,並且走進了一家汽車經銷店。在這種情況下,效用或回報是非數字屬性(即對交易的滿意度)。您希望在價格、汽車功能等方面獲得儘可能最好的交易,而汽車銷售員則希望獲得儘可能高的價格以最大化他的佣金。
在這種情況下,合作意味着不討價還價;你走進去,支付標價(這讓推銷員很高興),然後開着一輛新車離開。另一方面,叛逃意味着討價還價。你想要更低的價格,而推銷員想要更高的價格。用數值表示滿意度,其中 10 表示對交易完全滿意,0 表示不滿意,支付矩陣如下所示:
汽車買家與推銷員 – 收益矩陣 | 推銷員 | ||
合作 | 缺點 | ||
買方 | 合作 | (一) 7, 7 | (c) 0,10 |
缺點 | (b) 10, 0 | (d) 3, 3 |
這個矩陣告訴我們什麼?如果你進行了艱苦的討價還價並獲得了汽車價格的大幅降低,那麼你可能對這筆交易完全滿意,但推銷員可能會因爲佣金的損失而不滿意(如單元格b所示) 。
相反,如果推銷員堅持己見,在價格上不讓步,你可能對交易不滿意,而推銷員卻完全滿意(單元格 c)。
如果您只是走進去並支付全額標價(單元格 a),您的滿意度可能會降低。在這種情況下,推銷員也可能不太滿意,因爲你願意支付全價可能會讓他想知道他是否可以“引導”你購買更昂貴的型號,或者添加更多花哨的東西以獲得更多佣金。
單元格(d)顯示買賣雙方的滿意度要低得多,因爲長時間的討價還價可能最終導致在汽車價格上勉強妥協。
同樣,在薪資談判中,您可能不明智地接受潛在僱主向您提供的第一個報價(假設您知道自己更有價值)。
在困難的就業市場上,通過接受第一份工作來進行合作似乎是一個簡單的解決方案,但它可能會導致你留下一些錢。爲了更高的薪水而背叛(即談判)確實可能會給你帶來更豐厚的薪水。相反,如果僱主不願意支付更多費用,你可能會對最終的報價不滿意。
希望薪資談判不會變得激烈,因爲這可能會導致您和僱主的滿意度降低。前面顯示的買方-銷售員支付矩陣可以很容易地擴展,以顯示求職者與僱主的滿意度。
囚徒困境的例子是什麼?
這種“交換博弈”與囚徒困境具有相同的結構,並表明了合作的好處。格雷格 (Greg) 有一頂綠色帽子,更喜歡藍色帽子,而布倫達 (Brenda) 有一頂藍色帽子,更喜歡綠色帽子。兩者都寧願有兩個上限,也不願只有一個上限,也寧願有任何一個上限,也不願根本沒有上限。他們每個人都可以選擇保留自己擁有的帽子還是將其送給對方。無論羅斯保留她的帽子還是把它送給比爾,比爾最好保留他的帽子,如果他把帽子送給她,她的情況也會更好。無論比爾保留他的帽子還是把它送給羅斯,羅斯最好保留她的帽子,如果她把帽子送給他,他的情況也會更好。理想的情況是擁有兩頂帽子,但這隻有在一個人行爲自私的情況下才有可能實現——這意味着一個人沒有帽子。然而,如果他們交換帽子,比只保留現有的帽子更好,因爲這將是他們更喜歡的顏色。
囚徒困境中的主導策略是什麼?
在囚徒困境中,兩名嫌疑人(我們稱他們爲赫伯和李)都不知道另一名嫌疑人做出的決定。赫伯害怕保持沉默,因爲在這種情況下,如果李指責他,他可能會被判處更多年徒刑。如果赫伯選擇責怪李,只要李保持沉默,他就可以被釋放。然而,這不太可能,因爲李用同樣的理由,她也會責怪赫伯。
因此,兩名嫌疑人保持沉默的決定(信任與合作的最終結果)提供了更佳的回報(每個人的入獄時間更少)。但這並不是一個真正理性的選擇,因爲雙方都必然會爲了自己的利益而行動,並指責對方,以免浪費時間。因此,第二好的策略是讓兩名嫌疑人都坦白。與兩人都保持沉默相比,每一個人都會被判更多的刑期,但比一個人保持沉默而一個人招供的刑期要少。
如何克服囚徒困境?
隨着時間的推移,人們針對囚徒困境制定了各種解決方案,以克服個人動機而有利於共同利益。在現實世界中,大多數經濟和其他人類互動都會重複不止一次。真正的囚徒困境通常只玩一次;通過重複,人們可以開始預測他人的行爲,並從錯誤和不利結果中學習。
人們已經制定了正式的制度策略來改變個人決策者面臨的激勵。通過聲譽、規則、法律、民主或其他集體決策以及對叛逃的明確社會懲罰來強制執行合作行爲的集體行動,將許多囚徒困境轉變爲對集體有利的合作結果。
此外,隨着時間的推移,一些人和羣體會產生心理和行爲偏見,例如彼此之間更高的信任度,在反覆互動中對未來的長期導向,以及傾向於合作行爲的正互惠或背叛行爲的負互惠。隨着時間的推移,這些趨勢可能會通過社會內的自然選擇或不同競爭社會之間的羣體選擇而演變。實際上,它們導致一羣人“非理性”地選擇實際上對他們所有人最有利的結果。
公地悲劇是經濟中囚徒困境的一個典型例子。保護公共自然資源並對其繁殖進行再投資,以便能夠繼續消耗它,可能符合每個人的集體利益,但每個人總是有動力盡快消耗盡可能多的資源,這然後耗盡資源。
綜述
囚徒困境告訴我們,單純的合作並不總是符合一個人的最大利益。事實上,當購買汽車等大件商品時,從消費者的角度來看,討價還價是首選的行爲方式。否則,汽車經銷商可能會在價格談判中採取不靈活的政策,以實現利潤最大化,但導致消費者爲車輛支付過高的費用。
瞭解合作與背叛的相對回報可能會刺激您在進行大筆購買之前進行重要的價格談判。