囚犯的困境,最著名的困境之一遊戲理論,通過美林洪水和梅爾文·德雷斯(Melvin Dresher)概念化蘭德公司1950年。後來由加拿大數學家艾伯特·威廉·塔克(Albert William Tucker)命名。
囚犯的困境基本上提供了一個框架,以了解如何罷工合作與競爭之間的平衡並且是戰略決策的有用工具。結果,它發現了從商業,金融,經濟學和政治學到哲學,心理學,生物學和社會學的不同領域的應用。
關鍵要點
- 囚犯的困境描述了一種情況,根據遊戲理論,兩名玩家自私地表現最終將為兩者做出次優選擇。
- 囚犯的困境還向我們表明,僅僅合作並不總是符合人的最大利益。
- 當兩個競爭對手在市場上與之抗爭時,就會遇到囚犯在現實世界中的困境的一個典型例子。
- 在業務中,將某些決定的結構理解為囚犯的困境可能會帶來更有利的結果。
- 這種設置使人們可以平衡競爭和合作以獲得相互利益。
如何在商業中利用囚犯的困境
了解囚犯的困境
這囚犯的困境方案工作如下:兩名嫌疑人因犯罪而被逮捕,現在在警察局的單獨房間裡,沒有彼此交流。檢察官分別告訴他們以下內容:
- 如果您承認並同意對其他嫌疑人作證,沒有承認的人,對您的指控將被丟棄,您將不參加SCOT。
- 如果您不承認,但另一個嫌疑人會被定罪,檢方將尋求三年的最高刑期。
- 如果你們倆都承認,倆都將被判處兩年徒刑。
- 如果你們倆都承認,你們倆都將被指控輕罪,並將被判處一年徒刑。
犯罪嫌疑人應該做什麼?這是囚犯困境的本質。
囚犯困境的基本概念
必須存在一些基本概念來遵守囚犯的困境。這些概念包括:
- 必須有兩個球員。該方案涉及兩個人或實體,這些個人或實體涉及共同的情況,例如一起犯罪或面對相互決定。
- 決定同時做出。兩位球員都在不了解對方選擇的情況下做出決定。這種同時決策是困境的關鍵方面,因為各方必須在不考慮對方的決定的情況下做出決定。
- 結果必須結合在一起。回報矩陣是一張桌子,概述了玩家和相關的收益或每個玩家的結果的選擇組合。它有助於可視化不同決策的後果。稍後,我們將更多地談論季后賽矩陣。
- 可以有相互合作或相互背叛。玩家可以選擇彼此合作(選擇互惠互利的結果)或互相背叛(選擇自我服務的結果)。囚犯困境背後的張力來自個人和集體利益之間的衝突。
- 每個玩家都有一個主導的策略。該策略是為他們提供最佳結果的選擇,而不論其他球員的選擇如何。這種主要的策略通常是個人的理性選擇,當兩個球員都遵循時,會導致次優的結果。
- 假定球員是理性的決策者。這意味著人們傾向於最大化自己的自身利益。該假設是遊戲理論的基本方面,也是理性選擇模型,因為它驅動了期權之間的衝突。
評估最佳行動方案
讓我們從構造一個收益矩陣開始,如下表所示。此處的“回報”以監獄判決的長度表示(如負標誌所象徵;數字越高越好)。術語“合作”和“缺陷”是指彼此合作的嫌疑人(例如,如果兩個都不承認)或缺陷(即,不與其他玩家合作,那是一個嫌疑人承認的情況,而另一個則沒有)。單元格(a)至(d)中的第一個數字顯示了可疑A的回報,而第二個數字為可疑B表示。
囚犯的困境 - 回報矩陣 |
嫌疑人b |
||
合作 |
缺點 |
||
可疑a |
合作 |
(a)-1,-1 |
(c)-3,0 |
缺點 |
(b)0,-3 |
(d)-2,-2 |
無論其他玩家使用的策略如何,球員的主要策略是為該球員帶來最佳回報的策略。這裡的主要策略是讓每個玩家缺陷(即坦白),因為坦白會最大程度地減少在監獄中花費的平均時間。這是可能的結果:
- 如果A和B合作並留下媽媽,則兩者都在監獄中入獄一年,如牢房(a)所示。
- 如果A供認但B沒有,則A免費,B獲得了三年的時間 - 在牢房(b)中代表。
- 如果A不承認,而是B供認,A將獲得三年,而B則免費 - 請參閱Cell(c)。
- 如果A和B都承認,則兩年都被判入獄兩年,就像牢房(D)所示。
因此,如果供認,他們要么免費或入獄兩年。但是,如果他們不承認,他們要么被判入獄一年或三年。 b面對完全相同的困境。顯然,最好的策略是承認,無論其他嫌疑人做什麼。
囚犯困境的影響
囚犯的困境優雅地表明了每個人追求他們自己的自我利益,結果比他們倆都合作要糟。在上面的示例中,合作 - A和B都保持沉默,不承認 - 兩名嫌疑人總判處兩年的徒刑。所有其他結果都將導致三年或四年中的兩個結合句子。
實際上,一個只對自己獲得最大利益感興趣的理性人通常更喜歡缺陷,而不是合作。如果兩者都選擇缺陷,以假設對方不會,而不是最終進入牢房(b)或(c)選項(例如他們每個人都希望的,他們都會在牢房(d)位置(d)位置,而每個人都賺了兩年。
在囚犯的例子中,與其他嫌疑人合作提取了一年的不可避免的刑期,而在最好的情況下,認罪將導致被釋放,或者在最壞的情況下被判處兩年的刑期。但是,如果說A對B也將保持媽媽的信心被證明是放錯了位置的,並且B實際上承認(反之亦然),那麼如果說A也將保持媽媽的信心(反之亦然),則不會承認最高刑期為三年。
這種困境,即使合作可能會帶來最佳結果,在這種困境中,不合時宜(不合作)是如此強大,它在商業和經濟方面發揮了許多作用
快速事實
阿爾伯特·塔克(Albert Tucker)於1950年首次向斯坦福大學的一群研究生心理學專業的學生展示了囚犯的困境,這是遊戲理論的一個例子。
申請業務
當兩個競爭對手在市場上與之抗爭時,就會遇到囚犯在現實世界中的困境的一個典型例子。通常,許多經濟部門都有兩個主要競爭對手。例如,在美國,可口可樂之間存在激烈的競爭(那)和百事可樂(pep)在軟飲料和家得寶中(高畫質)與勞(Lowe)(低的)建築用品。這項競爭引起了商學院的眾多案例研究。其他激烈的競爭包括星巴克(驚愕)與蒂姆·霍頓(Tim Horton)(QSR)在加拿大和蘋果(AAPL)與三星在全球手機行業中。
考慮可口可樂與百事可樂的情況,並假設前者正在考慮降低其標誌性蘇打水的價格。如果是這樣,百事可樂可能別無選擇,只能效仿其可樂以保留其市場占有率。這可能會導致兩家公司的利潤大幅下降。
因此,這兩家公司的價格下跌可能被解釋為叛逃,因為它打破了隱含的同意,以保持價格高並最大化利潤。因此,如果可口可樂降低了價格,但百事可樂繼續保持高價,前者是叛逃的,而後者則在合作(通過堅持內在協議的精神)。在這種情況下,可口可樂可能會贏得市場份額,並通過出售更多的可樂來賺取增量利潤。
回報矩陣
讓我們假設可口可樂和百事可樂的增量利潤如下:
- 如果兩者都保持高價,則每個公司的利潤增加了5億美元(由於正常增長要求)。
- 如果一個下降價格(即缺陷),而另一個人沒有(合作),那麼前者的利潤增長了7.5億美元,因為市場份額更大,而後者沒有改變。
- 如果兩家公司都會降低價格,那麼軟飲料消費的增加抵消了較低的價格,並且每個公司的利潤都會增加2.5億美元。
收益矩陣看起來像這樣(數字代表數億美元的增量利潤):
可口可樂與百事可樂 - 回報矩陣 |
百事可樂 |
||
合作 |
缺點 |
||
可口可樂 |
合作 |
500,500 |
0,750 |
缺點 |
750,0 | 250,250 |
其他經常引用的囚犯的困境例子是在新產品或技術開發或公司的廣告和營銷支出等領域。
例如,如果兩家公司有一項隱含的協議,即在給定的一年中保持廣告預算不變,則淨利可能保持相對較高的水平。但是,如果一個人缺陷並提高了廣告預算,則可能會以犧牲另一家公司為代價獲得更大的利潤,因為較高的銷售額抵消了增加的廣告費用。但是,如果兩家公司都提高了廣告預算,那麼不斷增加的廣告工作可能會相互抵消並證明無效,從而降低了利潤(降低廣告費用),如果將廣告預算保持不變,那將是這種情況。
向經濟申請
民主黨人和共和黨人之間不時爆發的債務僵局是囚犯困境的一個典型例子。
假設解決美國債務問題的效用或利益將是下屆選舉中各方的選舉收益。在這種情況下,合作是指雙方願意努力維持現狀的意願美國預算赤字螺旋。叛逃意味著退出這一隱含協議,並採取控制赤字所需的步驟。
如果雙方合作並保持經濟順利進行,則可以確保一些選舉的收益。但是,如果政黨A試圖以主動的方式解決債務問題,而B方不合作,則該頑固性可能會在下次選舉中付出B票,這可能會歸給A。
但是,如果雙方都退出合作並打硬球以解決債務問題,則隨之而來的經濟動盪(滑動市場,可能的信貸降級和一個政府關閉)可能會導致雙方的選舉收益較低。
如何使用它?
囚犯的困境可用於在個人生活中許多領域的決策,例如購買汽車,工資談判等。
例如,假設你是在市場上的新車然後您走進汽車經銷店。在這種情況下,公用事業或回報是一個非數字屬性(即對交易的滿意度)。您想在價格,汽車功能等方面獲得最好的交易,而汽車推銷員則希望獲得最高的價格以最大程度地提高其佣金。
在這種情況下的合作意味著沒有討價還價。您走進去,支付標籤價格(非常滿意推銷員的喜悅),然後留下一輛新車。另一方面,缺陷意味著討價還價。您想要更低的價格,而推銷員則希望更高的價格。將數值分配給滿意度的水平,其中10表示對交易充分滿意,0表示不滿意,收益矩陣如下所示:
汽車購買者與推銷員 - 回報矩陣 |
推銷員 |
||
合作 |
缺點 |
||
買方 |
合作 |
(a)7,7 |
(c)0,10 |
缺點 |
(b)10,0 |
(d)3,3 |
這個矩陣告訴我們什麼?如果你駕車討價還價並大大降低了汽車價格,您可能會對這筆交易完全滿意,但是由於佣金的損失,推銷員可能會不滿意(如Cell B中可以看出)。相反,如果推銷員堅持自己的槍支並且不付出價格,那麼您可能對這筆交易不滿意,而推銷員會完全滿意(Cell C)。
如果您只是走進來並支付了全部標價(單元A),您的滿意度可能會更低。在這種情況下的推銷員也可能不滿意,因為您願意支付全價的意願可能會讓他想知道他是否可以將您“轉向”更昂貴的型號,或者增加了更多的鈴鐺和哨子以獲得更多委員會。
牢房(d)對買賣雙方的滿意度要低得多,因為長時間的討價還價最終可能導致了對汽車支付的價格的不情願折衷。同樣,通過薪水談判,您可能會不明智地接受潛在雇主向您提出的第一個提議(假設您知道自己的價值更高)。
在一個困難中,通過獲得第一個報價的合作似乎是一個簡單的解決方案就業市場,但這可能會導致您在桌子上留出一些錢。較高工資的叛逃(即談判)確實可以為您提供一個胖的薪水包。相反,如果雇主不願支付更多,您可能對最終要約不滿意。
希望,工資談判不要刺激地興奮不已,因為這可能會給您和雇主帶來較低的滿意度。前面顯示的買家 - 銷售者的收益矩陣可以輕鬆擴展,以顯示求職者與雇主的滿意度。
囚犯經濟學困難的例子
我們將通過談論囚犯在經濟學中如何出現的困境來結束這篇文章。可以在經濟低迷期間政府財政政策的背景下找到囚犯困境的宏觀經濟例子。當有經濟衰退時,各個政府面臨實施擴張性財政政策以刺激經濟增長的選擇。但是,這些政策的有效性取決於其他政府的行動。
考慮是否所有國家同時採用擴張性財政政策。全球經濟將受益於增加的總需求,從而導致潛在的恢復。但是,如果一個國家決定採用更保守的財政方法,專注於緊縮措施或削減預算,它可能會遇到短期的經濟穩定。但是,全球影響可能是有害的。
這種情況反映了囚犯的困境,因為每個政府必須通過共同實施擴張政策或通過採取更保守的措施來決定合作。如果所有國家合作,全球經濟都可以更有效地恢復。但是,如果一個或多個國家的缺陷並追求最大的個人利益,它可能會阻礙所有國家的恢復,從而導致更廣泛的群體的次優結果。
囚犯困境的最佳解決方案是什麼?
當僅與另一個球員比賽時,總是有利的。這意味著您可以保證贏或領帶,儘管這損害了另一個球員。請注意,當您與多個球員比賽時,合作和防守可能並不總是要求叛逃者。
納什平衡在囚犯困境中的意義是什麼?
當兩個參與者選擇背叛時,就會發生囚犯困境中的納什平衡,並且都沒有動力單方面改變其戰略。這個穩定的國家強調了由於參與者的自我利益而達到最佳合作的挑戰,強調了個人和集體理性之間的張力。
囚犯的困境可以應用於社會和道德困境嗎?
是的,囚犯的困境可用於許多不同的情況。在個人利益與集體利益相抵觸的情況下,對於更大的利益而言,必須進行合作,這是囚犯困境的動態。這可能是在社會環境,道德情況,稀缺資源的分配,為公共利益的供應以及許多其他情況下引起的。
囚犯困境的概念是否有批評或局限性?
是的。一個限制是,原始難題假設了一次性的,未重複的相互作用,而許多現實的情況涉及重複的相互作用。另一個限制是文化和背景因素可能會影響決策。這意味著不同的人可能會根據許多不同的,不可預測的原因選擇不同的選擇。最後,一些批評家可能會說,囚犯的困境可能會過分簡化人類及其複雜的行為。
底線
囚犯的困境向我們表明,僅僅合作並不總是符合人的最大利益。實際上,從消費者的角度來看,當購買諸如汽車之類的大型商品時,也是首選的行動。否則,汽車經銷商可能會採用價格談判中僵化的政策,最大程度地提高其利潤,但導致消費者對車輛的付費過多。
了解合作與缺陷的相對收益可能會激發您參與重要的收益價格談判在大筆購買之前。