在 2016 年的科幻電影《降臨》中,一位語言學家面臨破解一個語言的艱鉅任務。由回文短語組成的語言,向後讀與向前讀時相同,用圓形符號書寫。當她發現各種線索時,世界各地不同的國家對這些訊息有不同的解讀——有些人認為它們傳達了威脅。
如果人類今天最終陷入這樣的境地,我們最好的選擇可能是轉向研究,揭示如何(人工智慧)開發語言。
但語言的確切定義是什麼?我們大多數人至少使用一種方式與周圍的人交流,但它是如何產生的?語言學家一直在思考幾十年來這個問題,但沒有簡單的方法找出語言是如何演化的。
語言是短暫的,它在化石記錄中沒有留下任何可檢驗的痕跡。與骨頭不同,我們無法挖掘古代語言來研究它們是如何隨著時間的推移而發展的。
雖然我們可能無法研究人類語言的真正演化,但模擬也許可以提供一些見解。這就是人工智慧的用武之地——一個令人著迷的研究領域,稱為緊急通訊,這是我過去三年來研究的。
為了模擬語言如何進化,我們為代理程式(AI)提供了需要溝通的簡單任務,例如在遊戲中,一個機器人必須引導另一個機器人到網格上的特定位置,而不向其顯示地圖。我們(幾乎)對他們可以說什麼或如何說沒有任何限制——我們只是給他們任務,讓他們隨心所欲地解決它。
因為解決這些任務需要智能體相互交流,所以我們可以研究它們的交流如何隨著時間的推移而演變,以了解語言如何演變。
有關的:
相似的已經對人類進行了實驗。想像一下,您是一位講英語的人,與一位非英語人士配對。你的任務是指導你的夥伴從桌子上的各種物體中拿起一個綠色立方體。
您可以嘗試用手比出一個立方體形狀,並指向窗外的草地以指示綠色。隨著時間的推移,你們會一起發展出一種原始語言。也許您會為“立方體”和“綠色”創建特定的手勢或符號。透過反覆的交互,這些臨時的訊號會變得更加精緻和一致,形成一個基本的通訊系統。
這對於人工智慧來說也同樣有效。透過反覆試驗,他們學習溝通他們看到的物體,而他們的對話夥伴則學會理解它們。
但我們怎麼知道他們在說什麼?如果他們只與他們的人工對話夥伴而不是與我們一起發展這種語言,我們如何知道每個單字的意思?畢竟,一個特定的詞可能意味著“綠色”、“立方體”,或更糟——兩者兼而有之。這種解釋的挑戰是我研究的關鍵部分。
破解密碼
乍一看,理解人工智慧語言的任務似乎幾乎是不可能的。如果我嘗試與只會說英語的合作者說波蘭語(我的母語),我們就無法互相理解,甚至不知道每個單字的開頭和結尾。
人工智慧語言面臨的挑戰更大,因為它們可能以與人類語言模式完全不同的方式組織資訊。
幸運的是,語言學家已經發展出複雜的 工具使用資訊理論來解釋未知的語言。
正如考古學家從碎片中拼湊出古代語言一樣,我們使用人工智慧對話中的模式來理解它們的語言結構。有時我們會發現驚人的相似之處到人類語言,有時我們發現全新的溝通方式。
這些工具幫助我們窺探人工智慧通訊的“黑盒子”,揭示人工智慧代理如何開發自己獨特的資訊共享方式。
我最近的工作重點是利用代理人的所見所言來解釋他們的語言。想像一下,有一份您不知道的語言的對話記錄,以及每個發言者正在看的內容。我們可以將記錄中的模式與參與者視野中的物體進行匹配,從而在單字和物體之間建立統計聯繫。
例如,短語“yayo”可能與一隻飛過的鳥重合——我們可以猜測“yayo”是說話者表示“鳥”的詞。透過仔細分析這些模式,我們可以開始解碼通訊背後的意義。
在最新論文由我和我的同事在神經資訊處理系統 (NeurIPS) 的會議記錄中展示,我們表明這種方法可以用於對人工智慧的至少部分語言和語法進行逆向工程,讓我們深入了解它們如何可能會構建溝通。
外星人和自治系統
這與外星人有何關聯?我們正在開發的用於理解人工智慧語言的方法可以幫助我們破解未來的任何外星人通訊。
如果我們能夠獲得一些書面的外星文本以及一些上下文(例如與文本相關的視覺訊息),我們可以應用相同的統計工具來分析它們。我們今天開發的方法可能成為未來研究外星語言(稱為異種語言學)的有用工具。
但我們不需要找到外星人就能從這項研究中受益。有眾多的應用, 從改進語言模型像 ChatGPT 或 Claude 一樣改善自動駕駛車輛之間的通訊或無人機。
透過解碼新興語言,我們可以讓未來的技術更容易理解。無論是了解自動駕駛汽車如何協調其運動,還是人工智慧系統如何做出決策,我們不僅僅是在創建智慧系統,我們還在學習理解它們。