這些天成為孩子一定很難。天生太晚了,無法真正享受網際網路,為時過早宣布自己是上帝皇帝一個沙漠荒原奔跑缺水和guzzoline- 如果您嘗試用一點輕數學來麻木疼痛,那麼您很可能必須忍受第二個機器人。
“國際數學奧林匹克運動會是世界上最聰明的高中數學家的現代舞台,” Trieu Trinh和Thang Luong在Google Deepmind的研究科學家Trieu Trinh和Thang Luong寫道。新博客文章關於他們的突破性人工智能(AI)系統,字母計量法。
他們宣布,載流量計是“一種AI系統,該系統可以解決接近人類奧運會金醫師的複雜幾何問題 - AI表現的突破性”。 “在對30個奧林匹克幾何問題的基準測試中,在標準奧林匹克運動會的時間限制內解決了25個奧林匹克“幾何學”問題。對於比較[…],平均人類金牌得主解決了25.9個問題。”
令人印象深刻的不僅僅是系統在比賽中的得分。自計算機有史以來第一次數學證明以來已經過去了將近50年 - 本質上是一個蠻力的工作。四色定理- 從那以後,肯定是有爭議的計算機輔助證明的領域已經出現跳躍和界限。
但是最近,隨著大數據和高級機器學習技術的曙光,我們已經開始看到一種轉變(無論多麼輕微),從使用計算機作為簡單的數字緊縮器,而轉向可以產生的人工智能真正創造性的證據。
特林(Trinh)和盧恩(Luong)認為,載量計可以解決奧林匹克數學數學所面臨的複雜數學問題的事實,這可能標誌著AI研究中的關鍵里程碑。
到目前為止,這樣的計劃將至少面臨兩個重大障礙。首先,計算機是電腦;正如任何曾經寫出50頁代碼的人一樣,只有一個在第337行中被一個錯誤的半龍挫敗的事情都可以告訴您,他們在推理或扣除之類的事情上並不擅長。其次,數學是有點困難甚至教授最尖端的機器學習系統。
“神經網絡之類的學習系統在執行'代數推理'方面非常不好,”同樣DeepMind的David Saxton告訴新科學家早在2019年。
他補充說:“人類擅長[數學],但是他們正在使用當前人造學習系統所沒有的一般推理技能。”
然而,通過結合神經語言模型來應對這些挑戰 - 擅長進行快速預測,但可以通過象徵性的扣除引擎進行垃圾。 Trinh和Luong寫道,這些後一種機器“基於正式的邏輯,並使用明確的規則來得出結論”,使它們在理性扣除方面變得更好,但也使他們緩慢而僵化 - 尤其是在自己處理大型,複雜的問題時。 ”
這兩個系統共同使用了一種循環:符號扣除引擎將忽略問題,直到卡住為止,這時語言模型將為論點提出調整。這是一個很棒的理論 - 只有一個問題。他們會訓練什麼語言模型?
理想情況下,該程序將被餵食數百萬,即使不是數十億人製造的幾何證明,然後可以咀嚼並以不同級別的Gobbledegook吐出。但是,“人製造”和“幾何”與“計算機程序” - “ [字母計量法]沒有'看到'有關解決的問題的任何內容,” Stanislas Dehaene是研究基礎知識的認知神經科學家,他告訴基礎幾何知識,紐約時報。 “絕對沒有對系統學會操縱的圓,線條和三角形的空間看法。”
因此,團隊必須提出其他解決方案。 Trinh和Luong解釋說:“使用高度平行的計算,該系統是從生成十億個幾何學對象的隨機圖開始的,並詳盡得出了每個圖中的點和線之間的所有關係。”
他們繼續說:“載流量計找到了每個圖中包含的所有證明,然後向後工作,以找出需要哪些其他構造來獲得這些證明。”他們稱此過程為“象徵性扣除和追溯”。
顯然,這是成功的:不僅AI與普通人類IMO金牌得主一樣出色,而且是嘗試挑戰的先前最新系統的2.5倍。兩人指出:“僅它的幾何能力就使其成為世界上第一個能夠在2000年和2015年通過IMO銅牌閾值的AI模型。”
儘管該系統目前僅限於幾何問題,但Trinh和Luong希望將數學AI的能力擴展到更多的學科中。
特林告訴《泰晤士報》:“我們沒有做出逐步的改進。” “我們正在取得巨大的進步,就結果而言,這是一個很大的突破。”
他補充說:“只是不要過度誇大它。”