遊戲理論是對玩家如何以及為什麼對自己的情況做出決定的研究。使用遊戲理論,在定價競賽等情況下的現實情況和產品發行可以佈置,並預測其結果。公司可以使用遊戲理論來確定納什平衡並查看其預算或定價策略的好處。
關鍵要點
- 遊戲理論是對玩家做出決策的研究。
- NASH平衡可幫助球員確定最佳的回報,這不僅基於他們的決策,而且還基於其他各方的決定。
- 公司可以使用遊戲理論來預測定價競爭和產品發行的結果。
轉了誰?
支持者遊戲理論通常在所謂的矩陣中表現出不同的結果。當轉彎播放順序遊戲時,每位玩家同時進行決定。通過同時遊戲,參與者不再使用常見的介紹方法向後誘導。
球員一 /球員兩個 | 左邊 | 正確的 |
向上 | (1,3) | (4,2) |
向下 | (3,2) | (3,1) |
該矩陣稱為正常形式。播放器一個選擇顯示在左垂直軸上,並且播放器二的選擇顯示在頂部的水平軸上。每個玩家的收益在相應的交叉點中,顯示如下(玩家一,播放器二)。
重要的
遊戲理論推測,一個玩家的回報取決於另一個玩家實施的策略。
納什平衡
納什均衡是達到的結果,一旦實現,就意味著沒有球員可以通過單方面改變決策來增加收益。從某種意義上說,一旦做出決定,考慮到後果的決定就不會後悔,也可以將其視為“不後悔”。
在大多數情況下,隨著時間的流逝,NASH平衡會達到。但是,一旦達到NASH平衡,它就不會偏離。在學習瞭如何找到NASH平衡之後,個人可以看一下單方面的移動將如何影響情況。這有意義嗎?它不應該,這就是為什麼納什均衡被描述為“不後悔”的原因。
尋找納什均衡
第一步:確定玩家對玩家兩人動作的最佳反應。
在檢查可能最大化玩家付款的選擇時,玩家如何響應兩個選項播放器的選擇?視覺上執行此操作的一種簡單方法是掩蓋玩家二的選擇。考慮示例矩陣:
球員一 /球員兩個 | 左邊 | 正確的 |
向上 | (1, - ) | (4, - ) |
向下 | (3, - ) | (3, - ) |
玩家一個可以玩的兩個可能的選擇:“向上”或“向下”。玩家二有兩個選擇要播放:“左”或“右”。在確定納什均衡的此步驟中,請查看對玩家二的動作的反應。如果玩家兩個選擇玩“左”,我們可以以1的回報播放“ UP”,或者以3的回報打“向下”。由於3大於1,我們將大膽3,指示玩“降低”的選項。
如果兩個玩家兩個選擇玩“正確”,我們可以選擇“向上播放”以獲得4的回報,或者以3的回報播放。由於4大於3,因此我們大膽4指示播放“ UP”的選項。這大膽的結果如下顯示在完整矩陣上。
球員一 /球員兩個 | 左邊 | 正確的 |
向上 | (1,3) | ((4,2) |
向下 | ((3,2) | (3,1) |
第二步:確定玩家兩者對玩家一號動作的最佳響應。
就像我們以前對玩家一個球員的回報一樣,我們將在確定播放器兩個最佳響應時隱藏玩家一的回報。
球員一 /球員兩個 | 左邊 | 正確的 |
向上 | ( - ,3) | ( - ,2) |
向下 | ( - ,2) | ( - ,1) |
就像在看球員時一樣,每個玩家都有兩個選擇。如果一個玩家選擇玩“ UP”,我們可以踢“左”,收益為3或“右”,收益為2。由於3大於2,我們大膽3顯示出播放“左”的選項。如果一個玩家選擇玩“倒下”,我們可以玩“左”以獲得2或“右”的回報。 1的回報。由於2大於12,,指示播放“左”的選項。這大膽的結果如下顯示在完整矩陣上。
球員一 /球員兩個 | 左邊 | 正確的 |
向上 | (1,3) | (4,2) |
向下 | (3,2) | (3,1) |
第三步:確定哪些結果具有粗體。該特殊結果是納什均衡。
現在,我們將大膽的兩個播放器的選項都可以進入完整的矩陣。
球員一 /球員兩個 | 左邊 | 正確的 |
向上 | (1,3) | ((4,2) |
向下 | ((3,,,,2) | (3,1) |
尋找兩個收益的交叉點大膽的。在這種情況下,我們發現(向下,左)的交集(3,2)適合我們的標準。這表明我們的納什均衡。
這種發現NASH平衡的方法非常適合查找平衡在同時進行的遊戲中,因為我們正在研究玩家將如何獨立於其他人的行為反應。
航空公司定價示例
同時遊戲的這種情況通常在航空公司等企業中進行。下面是與上面遊戲相似的一個例子,說明航空公司的價格如何發揮作用。支出為數千美元。請記住,這些是支出,而不是價格。我們先前應用的方法已經應用於顯示出現NASH平衡的位置。
航空公司一 /航空公司兩個 | 低價 | 高價 |
低價 | ((3,000,,,,3,000) | ((4,000,2,000) |
高價 | (2,000,4,000) | (3,500,3,500) |
從A1的選擇來看,我們看到,如果A2選擇玩低價,我們在3,000的低價或2,000的高價之間進行選擇。我們選擇低自3,000> 2,000。我們為A2打高價而做同樣的事情,並看到我們玩得很低,因為4,000> 3,500。
相反,查看A2的選擇,我們可以看到,如果A1選擇玩低價,我們以3,000的價格選擇“低價”和2,000的“高價”。由於3,000> 2,000,我們在此處選擇“低”價格選項。如果A1的價格“高”價格,我們可以收取低價4,000或3500的高價。由於4,000> 3,500,我們選擇在這裡玩低價。
NASH的均衡是,兩家航空公司都將收取低價的費用(在強調各方的選擇時顯示)。如果兩家航空公司都收取高價,那麼他們每個人都會比納什均衡狀態更好。
那他們為什麼不同意這樣做呢?這是非法的串通。如果發生這種情況,則代表一家航空公司向低價收取的單方面行動將是有益的,從而導致該航空公司又賺了更多的錢。該邏輯還顯示瞭如何達到NASH平衡,以及一旦達到它而偏離它是不利的。
誰發展了NASH平衡?
可以有多個納什平衡嗎?
遊戲中可能有一個以上的平衡。但是,這通常發生在與兩個玩家的兩個選擇更複雜的遊戲中。在隨著時間的推移隨時間重複的同時遊戲中,經過一定的反複試驗,這些多重均衡是達到的。在達到平衡之前,隨著時間的推移選擇不同選擇的這種情況是商業世界中最常播放的情況,當時兩家公司正在確定高度的價格可互換產品,例如機票或軟飲料。
遊戲理論如何幫助找到最佳的回報?
使用NASH平衡有助於玩家決定在情況下,不僅基於他們的決定,而且還基於其他各方的決定,最佳的回報。
底線
使用這些高級方法,可以對更多的現實情況進行建模和解決。各種納什平衡是現實世界中最常見的解決方案。遊戲理論的工作知識可以幫助個人和公司製定一種戰略,無論是玩TIC-TAC-TOE還是爭奪最大的利潤。