商業和經濟中的囚徒困境

  |  

囚徒困境——

收益矩陣

嫌疑人乙

合作

缺點

嫌疑人A

合作

(一)-1,-1 (c)-3, 0

缺點

(b) 0, -3 (d) -2, -2

玩家的佔優策略是一種能夠爲該玩家帶來最佳收益的策略,而不管其他玩家採用的策略如何。這裏的主導策略是每個玩家叛逃(即坦白),因爲坦白可以最大限度地減少平均入獄時間。以下是可能的結果:

  • 如果 A 和 B 合作並保持沉默,兩人都會被判入獄一年——如牢房 (a) 所示。
  • 如果 A 認罪但 B 不認罪,則 A 被釋放,B 被判三年有期徒刑——如牢房 (b) 所示。
  • 如果 A 不認罪,但 B 認罪,A 被判三年徒刑,B 被釋放——參見單元格 (c)。
  • 如果 A 和 B 都坦白,兩人都會被判入獄兩年——如牢房 (d) 所示。

因此,如果 A 認罪,他們要麼獲釋,要麼入獄兩年。但如果他們不認罪,他們要麼被判一年或三年監禁。 B面臨着完全相同的困境。顯然,最好的策略是坦白,無論其他嫌疑人做了什麼。

囚徒困境的影響

囚徒困境巧妙地表明,當每個人都追求自己的私利時,結果會比雙方合作更糟糕。在上面的例子中,合作——A和B都保持沉默且不招供——將使兩名嫌疑人總共被判處兩年監禁。所有其他結果將導致三年或四年中的兩年的合併判決。

事實上,一個只關心自己利益最大化的理性人通常會選擇背叛,而不是合作。如果雙方都選擇叛逃,假設對方不會,那麼他們最終不會像他們每個人所希望的那樣進入單元格 (b) 或 (c) 選項,而是最終進入單元格 (d) 位置,並且每個人都會獲得 2入獄多年。

在囚犯的例子中,與另一名嫌疑人合作不可避免地會被判處一年徒刑,而坦白在最好的情況下會被釋放,最壞的情況下會被判處兩年徒刑。然而,如果A相信B也保持沉默的信心被證明是錯誤的,而B實際上坦白了(反之亦然),那麼不坦白就有可能被判處最高三年徒刑。

儘管合作可能產生最佳結果,但背叛(不合作)的動機卻如此強烈,這種困境在商業和經濟中以多種方式表現出來

1950 年,阿爾伯特·塔克 (Albert Tucker) 首次向斯坦福大學的一羣心理學研究生提出了囚徒困境,作爲博弈論的一個例子。

商業應用

現實世界中囚徒困境的一個典型例子是當兩個競爭對手在市場上展開較量時遇到的。通常,許多經濟部門都有兩個主要競爭對手。例如,在美國,可口可樂 ( KO ) 和百事可樂 ( PEP ) 在軟飲料領域展開激烈競爭,家得寶 ( HD ) 與勞氏 ( LOW ) 在建築用品領域展開激烈競爭。該競賽在商學院引發了大量案例研究。其他激烈的競爭包括加拿大星巴克 ( SBUX ) 與蒂姆霍頓 ( THI ) 的競爭,以及全球手機領域蘋果 ( AAPL ) 與三星的競爭。

考慮可口可樂與百事可樂的案例,並假設前者正在考慮降低其標誌性汽水的價格。如果這樣做,百事可樂可能別無選擇,只能效仿其可樂以保住其市場份額。這可能會導致兩家公司的利潤大幅下降。

因此,任何一家公司的價格下降都可能被視爲背叛,因爲它違反了保持高價格和利潤最大化的隱含協議。因此,如果可口可樂降低價格,但百事可樂繼續保持高價格,則前者是背叛,而後者是合作(通過堅持默示協議的精神)。在這種情況下,可口可樂可能會通過銷售更多的可樂來贏得市場份額並賺取增量利潤。

收益矩陣

假設可口可樂和百事可樂的增量利潤如下:

  • 如果兩者都保持高價格,則每家公司的利潤將增加 5 億美元(因爲需求的正常增長)。
  • 如果其中一方降價(即缺陷),而另一方不降價(即合作),則前者的利潤會因更大的市場份額而增加 7.5 億美元,而後者的利潤則保持不變。
  • 如果兩家公司都降低價格,軟飲料消費量的增加將抵消價格的下降,每家公司的利潤將增加 2.5 億美元。

收益矩陣如下所示(數字代表增量利潤,以億計):

可口可樂與百事可樂 –

收益矩陣

百事可樂

合作

缺點

可口可樂

合作

500, 500 0, 750

缺點

750, 0 250, 250

其他經常被引用的囚徒困境例子包括新產品或技術開發或公司的廣告和營銷支出等領域。

例如,如果兩家公司隱含協議在某一年保持廣告預算不變,那麼它們的淨利潤可能會保持在相對較高的水平。但如果一家公司出現缺陷並提高其廣告預算,它可能會以犧牲另一家公司的利益爲代價獲得更大的利潤,因爲更高的銷售額抵消了增加的廣告費用。然而,如果兩家公司都增加廣告預算,那麼增加的廣告力度可能會相互抵消並被證明是無效的,從而導致利潤較低(由於廣告費用較高),而廣告預算保持不變的情況會出現這種情況。

經濟應用

時不時出現的美國民主黨和共和黨之間的債務僵局就是囚徒困境的典型例子。

假設解決美國債務問題的效用或好處將是各黨派在下次選舉中的選舉收益。這裏的合作是指雙方願意努力維持美國不斷上升的預算赤字的現狀。背叛意味着放棄這一隱含的協議,並採取必要的措施控制赤字。

如果雙方合作並保持經濟平穩運行,一些選舉收益是有保證的。但如果甲方試圖主動解決債務問題,而乙方不配合,這種頑抗可能會讓B方在下次選舉中失去選票,而這些選票可能會流向A方。

然而,如果雙方在解決債務問題時放棄合作並採取強硬態度,那麼隨之而來的經濟動盪(市場下滑、可能的信用評級下調以及政府關門)可能會導致雙方的選舉收益下降。

您如何使用它?

囚徒困境可以用來幫助個人生活中許多領域的決策,例如購買汽車、薪資談判等。

例如,假設您正在市場上購買一輛新車,並且走進了一家汽車經銷店。在這種情況下,效用或回報是非數字屬性(即對交易的滿意度)。您希望在價格、汽車功能等方面獲得儘可能最好的交易,而汽車銷售員則希望獲得儘可能高的價格以最大化他的佣金。

在這種情況下,合作意味着不討價還價;你走進去,支付標價(這讓推銷員很高興),然後開着一輛新車離開。另一方面,叛逃意味着討價還價。你想要更低的價格,而推銷員想要更高的價格。用數值表示滿意度,其中 10 表示對交易完全滿意,0 表示不滿意,支付矩陣如下所示:

汽車買家與推銷員 –

收益矩陣

推銷員

合作

缺點

買方

合作

(一) 7, 7 (c) 0,10

缺點

(b) 10, 0 (d) 3, 3

這個矩陣告訴我們什麼?如果你進行了艱苦的討價還價並獲得了汽車價格的大幅降低,那麼你可能對這筆交易完全滿意,但推銷員可能會因爲佣金的損失而不滿意(如單元格b所示) 。

相反,如果推銷員堅持己見,在價格上不讓步,你可能對交易不滿意,而推銷員卻完全滿意(單元格 c)。

如果您只是走進去並支付全額標價(單元格 a),您的滿意度可能會降低。在這種情況下,推銷員也可能不太滿意,因爲你願意支付全價可能會讓他想知道他是否可以“引導”你購買更昂貴的型號,或者添加更多花哨的東西以獲得更多佣金

單元格(d)顯示買賣雙方的滿意度要低得多,因爲長時間的討價還價可能最終導致在汽車價格上勉強妥協。

同樣,在薪資談判中,您可能不明智地接受潛在僱主向您提供的第一個報價(假設您知道自己更有價值)。

在困難的就業市場上,通過接受第一份工作來進行合作似乎是一個簡單的解決方案,但它可能會導致你留下一些錢。爲了更高的薪水而背叛(即談判)確實可能會給你帶來更豐厚的薪水。相反,如果僱主不願意支付更多費用,你可能會對最終的報價不滿意。

希望薪資談判不會變得激烈,因爲這可能會導致您和僱主的滿意度降低。前面顯示的買方-銷售員支付矩陣可以很容易地擴展,以顯示求職者與僱主的滿意度。

囚徒困境的例子是什麼?

這種“交換博弈”與囚徒困境具有相同的結構,並表明了合作的好處。格雷格 (Greg) 有一頂綠色帽子,更喜歡藍色帽子,而布倫達 (Brenda) 有一頂藍色帽子,更喜歡綠色帽子。兩者都寧願有兩個上限,也不願只有一個上限,也寧願有任何一個上限,也不願根本沒有上限。他們每個人都可以選擇保留自己擁有的帽子還是將其送給對方。無論羅斯保留她的帽子還是把它送給比爾,比爾最好保留他的帽子,如果他把帽子送給她,她的情況也會更好。無論比爾保留他的帽子還是把它送給羅斯,羅斯最好保留她的帽子,如果她把帽子送給他,他的情況也會更好。理想的情況是擁有兩頂帽子,但這隻有在一個人行爲自私的情況下才有可能實現——這意味着一個人沒有帽子。然而,如果他們交換帽子,比只保留現有的帽子更好,因爲這將是他們更喜歡的顏色。

囚徒困境中的主導策略是什麼?

在囚徒困境中,兩名嫌疑人(我們稱他們爲赫伯和李)都不知道另一名嫌疑人做出的決定。赫伯害怕保持沉默,因爲在這種情況下,如果李指責他,他可能會被判處更多年徒刑。如果赫伯選擇責怪李,只要李保持沉默,他就可以被釋放。然而,這不太可能,因爲李用同樣的理由,她也會責怪赫伯。

因此,兩名嫌疑人保持沉默的決定(信任與合作的最終結果)提供了更佳的回報(每個人的入獄時間更少)。但這並不是一個真正理性的選擇,因爲雙方都必然會爲了自己的利益而行動,並指責對方,以免浪費時間。因此,第二好的策略是讓兩名嫌疑人都坦白。與兩人都保持沉默相比,每一個人都會被判更多的刑期,但比一個人保持沉默而一個人招供的刑期要少。

如何克服囚徒困境?

隨着時間的推移,人們針對囚徒困境制定了各種解決方案,以克服個人動機而有利於共同利益。在現實世界中,大多數經濟和其他人類互動都會重複不止一次。真正的囚徒困境通常只玩一次;通過重複,人們可以開始預測他人的行爲,並從錯誤和不利結果中學習。

人們已經制定了正式的制度策略來改變個人決策者面臨的激勵。通過聲譽、規則、法律、民主或其他集體決策以及對叛逃的明確社會懲罰來強制執行合作行爲的集體行動,將許多囚徒困境轉變爲對集體有利的合作結果。

此外,隨着時間的推移,一些人和羣體會產生心理和行爲偏見,例如彼此之間更高的信任度,在反覆互動中對未來的長期導向,以及傾向於合作行爲的正互惠或背叛行爲的負互惠。隨着時間的推移,這些趨勢可能會通過社會內的自然選擇或不同競爭社會之間的羣體選擇而演變。實際上,它們導致一羣人“非理性”地選擇實際上對他們所有人最有利的結果。


公地悲劇是經濟中囚徒困境的一個典型例子。保護公共自然資源並對其繁殖進行再投資,以便能夠繼續消耗它,可能符合每個人的集體利益,但每個人總是有動力盡快消耗盡可能多的資源,這然後耗盡資源。

綜述

囚徒困境告訴我們,單純的合作並不總是符合一個人的最大利益。事實上,當購買汽車等大件商品時,從消費者的角度來看,討價還價是首選的行爲方式。否則,汽車經銷商可能會在價格談判中採取不靈活的政策,以實現利潤最大化,但導致消費者爲車輛支付過高的費用。

瞭解合作與背叛的相對回報可能會刺激您在進行大筆購買之前進行重要的價格談判

推薦閱讀

相關文章

擴張性貨幣政策的例子

中央銀行可以採取的一些行動是擴張性貨幣政策。貨幣政策是爲影響一個國家的經濟而採取的行動。中央銀行用於擴大經濟的關鍵步驟包括:降低貼現率。購買政府證券。降低準備金要求。所有這些選項都有相同的目的;擴大國家的貨幣供應量。關鍵點中央銀行,例如美國的美聯儲,將使用擴張性貨幣政策來加強經濟。

2021 年綜合撥款法案:裏面有什麼,沒有什麼

2020 年 12 月 21 日,國會批准了一項長達 2,124 頁、2.3 萬億美元的資金計劃,其中包括一項 9,000 億美元的年底 COVID-19 刺激法案,以及一項 1.4 萬億美元的綜合支出法案,以資助政府到 9 月 20 日。 2021 年 1 月 30 日。

8 保護員工的聯邦法律

曾經有一段時間,工人們在與工作相關的安全和福利方面任由僱主擺佈,更不用說招聘和晉升了。然而,在 20 世紀,推動員工權利的勢頭越來越大,導致了今天數百萬美國人依賴的一系列重要的勞動保護法。如今,美國勞工部實施了大約 180 項工人保護法,範圍從工資要求到育兒假福利。其他保護由美國平等就業機會委員會等機構監督。

LGBTQ+ 薪酬差距和失業

儘管與其他值得注意的薪酬差距相比,它受到的關注較少,但數據顯示,美國 LGBTQ+ 社區存在薪酬差距。對私營和公共部門歧視的國家研究指出,幾十年前對 LGBTQ+ 工人的普遍就業歧視,尤其是對跨性別和雙性戀工人的歧視。收入不平等是指收入分配不均,有利於某些人口羣體而不是其他羣體。

雜草合法化的經濟效益

儘管總統選舉在 2020 年 11 月引起了大部分關注,但民意調查還做出了其他幾項重要決定:值得注意的是,幾個州舉行了投票,以一種或另一種形式確定合法大麻產業的未來。從科羅拉多州或華盛頓的書中吸取教訓,四個州——新澤西州、南達科他州、蒙大拿州和亞利桑那州——決定將用於娛樂目的的大麻消費合法化。

中國四大銀行

進入21世紀,中國在全球金融中的地位越來越重要。事實上,根據 S&P Global Market Intelligence 的 2021 年度排名,世界上最大的四家銀行(按資產規模)是中國的:中國工商銀行、中國建設銀行、中國銀行和中國農業銀行。

相關詞條

平價醫療法案 (ACA)

什麼是平價醫療法案 (ACA)?平價醫療法案 (ACA) 是由巴拉克奧巴馬總統於 2010 年 3 月簽署成爲法律的全面醫療改革。該法案的正式名稱爲《患者保護和平價醫療法案》,通常稱爲奧巴馬醫改,其中包括旨在擴大可及性的醫療保健政策清單向數百萬沒有保險的美國人提供醫療保險。

廣場協議定義

什麼是廣場協議?廣場協議是 1985 年 G-5 國家(法國、德國、美國、英國和日本)之間達成的一項協議,旨在通過讓美元相對於日元和德國馬克貶值來操縱匯率。廣場協議又稱廣場協議,其目的是糾正美德、美日之間的貿易不平衡,但只是糾正了與前者的貿易平衡。

排除項目定義

什麼是排除項目? “排除項目”是指將某些因素排除在整體計算之外以消除可能影響其可比性或扭曲長期預測的波動性的常見做法。高度波動的項目可能會掩蓋短期內的長期趨勢。排除項目是那些反映一次性事件的項目,否則這些事件可能會在經濟數據系列或財務報表中產生異常峯值。

資本收益定義

什麼是資本收益?資本收益一詞是指出售資產時資本資產價值的增加 簡單地說,當您以高於最初支付的價格出售資產時,就會產生資本收益。您擁有的幾乎任何類型的資產都是資本資產,無論是一種投資(如股票、債券或房地產)還是爲個人使用而購買的東西(如傢俱或船)。當您通過從銷售價格中減去原始購買價格來出售資產時,就會實現資本收益。

短期利息理論定義

什麼是短期利率理論?空頭興趣理論指出,高水平的空頭興趣是一個看漲指標。因此,該理論的追隨者將尋求購買嚴重做空的股票並從預期的價格上漲中獲利。這種做法與大多數投資者的普遍看法背道而馳,他們認為賣空表明被賣空的股票可能會下跌。因此,短期利率理論可以被視為一種逆向投資方法。

重複囚徒困境:定義、示例、策略

什麼是重複囚徒困境?迭代囚徒困境是一般形式的延伸,只不過博弈是由相同的參與者重複進行的。迭代囚徒困境與囚徒困境的原始概念不同,因爲參與者可以瞭解對方的行爲傾向。反覆出現的囚徒困境有時被稱爲和平戰爭遊戲。理解重複的囚徒困境由於遊戲是重複的,一個人可以制定一種不遵循孤立回合常規邏輯慣例的策略。