
計算機已經弄清楚瞭如何在國際象棋,Checkers和Tic-Tac-toe中獲勝,現在,計算機程序征服了撲克遊戲。
由加拿大艾伯塔省大學計算機科學教授邁克爾·鮑林(Michael Bowling)領導的研究團隊開發了一項計算機程序,可以在兩人撲克遊戲中勝過人類,特別是,頭部限制限制了。結果可能對其他情況具有深遠的影響需要復雜的決策,例如外交政策或醫療。
與國際象棋或跳棋不同,在撲克中,一個玩家並不總是知道其他玩家的過去。另外,當其他玩家折疊時,玩家可以贏得一隻手。因此,用數學術語來說,遊戲具有不完美的信息。 [十大革命計算機這是給出的
“棋有一個完美的遊戲解決方案 - 給定位置的答案是黑色的勝利,白色或平局的勝利。 ”鮑林說:“撲克更具概率。 “換句話說,沒有絕對完美的手或策略。
它如何工作
在Hold'Em Poker的版本中電腦玩了,兩個球員之間的賭注是固定的,加薪的數量有限。經銷商給每個玩家提供兩張名為“孔卡”的卡。隨後進行了一輪投注,稱為“前彈頭”。之後,桌子上又佈置了三張卡片,稱為“翻牌”。翻牌是一組社區卡,臉部交易,所以兩個球員都知道他們是什麼。隨後是另一輪投注,然後將第四張卡放在桌子上,稱為“轉彎”。經過第三輪之後博彩,最後一張社區卡已被處理(這被稱為“河流”),到那時,球員必須顯示自己的洞卡,假設一名球員尚未折疊。
計算機沒有計算所有可能的手。相反,它在遊戲啟動之前構建了結果表。使用約4,000個中央加工單元兩個月(等於大約1000年的計算時間),它模擬了數十億手的撲克手。保齡球說,僅結果表就佔用了約15台計算機存儲。為了進行比較,台式機的典型備份驅動器是一個trabyte。 [10種將改變您生活的技術這是給出的
該算法通過對方玩家可能擁有的所有可能的手,然後對每種策略的結果都取得了成績,例如,提高,折疊或呼叫下注(即與對手匹配)。為了了解任務有多大,遊戲中可能會出現13.8萬億不同的情況。要到達那裡,地球上的每個人都必須扮演近4,000只撲克。
這與國際象棋有所不同計算機可以蠻力計算動作隨著遊戲的進行,獲得足夠好的結果以獲勝的結果。 (與許多人的想法相反,實際上很少有計算機程序經歷每一個置換,只是產生最佳結果的計算機程序)。相反,請想像一下,如果棋子的計算機必須查找以前數十億場遊戲的結果,並具有特定的板塊配置。
隨著數十億人的播放,該程序提出最佳策略- 也就是說,它會收斂於給定手的最佳動作。鮑林說:“這種工作方式……它已經播放了撲克的十億手。”
掌握遊戲
由於撲克無法像國際象棋或檢查員那樣解決,因此保齡球和他的團隊提出了一系列對遊戲“解決”的要求。用科學的角度來看,遊戲是“基本解決的”,這意味著有一種方法可以利用計算機使用的策略。研究人員認為一個人每天玩70年,每年365天,每天24小時。他們寫的節目表現出色,以至於如果大盲人(固定的賭注)為$ 1,000,那麼最完美的球員可以獲勝的最多是每隻手$ 1,或者是1/1000的大盲人。
其他專家也從事賭場中使用的撲克玩具計算機,至少一家公司表示,它設計了一個機器學習算法根據人類玩家,調整策略。但是,沒有人證明其可剝削性 - 完美的人類玩家擊敗機器的能力 - 與保齡球團隊設計的計劃一樣小。也沒有任何以數學上嚴格的方式解決遊戲的問題。
但是該算法確實有局限性。首先,它僅與雙手游戲一起使用。在三人遊戲中,一個玩家可能會有一個可怕的策略(例如,玩家傾向於一直升高的趨勢),並且輸掉了比第二個具有更好策略的第二名球員的損失,從而贏得了第三名球員的勝利。
另一個問題是弄清楚如何公平測試三人遊戲。一個實驗可以讓兩個人玩這台機器,但保齡球說,即使是無意的,人類玩家也可能會碰撞機器。在與兩個機器玩家和一個人的實驗中,可能會出現類似的問題:即使兩個程序沒有碰撞,也可能看起來像人類。他說:“我們不知道該如何公平運行。”
鮑林說,這項技術可能具有多種用途,從國家安全到跟踪過境系統的票價,再到對醫療的決定。例如,該計劃可以幫助需要做出治療決定但不確定可能的結果的醫生。撲克計劃中使用的方法可以幫助醫生確定具有最佳結果的治療方案,或者是成功的最佳可能性。
該研究今天在網上(1月8日)在《科學雜誌》上進行了描述。
遵循現場科學@livescience,,,,Facebook和Google+。原始文章現場科學。