科學家們剛剛從失傳已久的電腦程式碼中復活了世界上第一個聊天機器人「ELIZA」——而且它仍然效果非常好。
這些「軟體考古學家」利用麻省理工學院檔案中佈滿灰塵的印刷輸出,發現了丟失 60 年的失效代碼,並將其復活。
ELIZA 是 20 世紀 60 年代由 MIT 教授開發的約瑟夫·魏森鮑姆並以戲劇《皮格馬利翁》的主角伊麗莎·杜利特爾 (Eliza Doolittle) 的名字命名,她被教導如何像英國貴族女性一樣說話。
作為使用者可以互動的語言模型,ELIZA 對當今的(人工智慧),研究人員在預印本資料庫上發布的一篇論文中寫道arXiv週日(1 月 12 日)。為 ELIZA 編寫的「DOCTOR」腳本被編程為像心理治療師一樣回答問題。為了例子,ELIZA 會說,“請告訴我你的問題。”如果使用者輸入“男人都是相似的”,程式就會回答“以什麼方式”。
Weizenbaum 使用他發明的一種現已廢棄的程式語言編寫了 ELIZA,該語言稱為密西根演算法解碼器對稱列表處理器 (MAD-SLIP),但它幾乎立即被複製到 Lisp 語言中。隨著早期互聯網的出現,ELIZA 的 Lisp 版本迅速流行,原始版本已經過時。
有關的:
專家認為原始的 420 行 ELIZA 程式碼直到 2021 年才遺失,當時該研究的合著者傑夫·施雷格,史丹佛大學的認知科學家,以及邁爾斯·克勞利麻省理工學院檔案管理員在其中發現了它魏岑鮑姆的論文。
「我對早期人工智慧先驅的想法特別感興趣,」施雷格在一封電子郵件中告訴《生活科學》。 “擁有計算機科學家的代碼就相當於記錄了他們的想法,而 ELIZA 曾經是並且仍然是早期人工智能的試金石,無論好壞,我想知道他的想法是什麼。”但他說,團隊想讓 ELIZA 發揮作用的原因更為複雜。
「從技術角度來看,我們甚至不知道我們發現的程式碼——迄今為止發現的唯一版本——實際上有效,」施拉格說。所以他們意識到他們必須嘗試。
復活伊麗莎
讓 ELIZA 起死回生並不容易。它要求團隊清理和調試程式碼,並創建一個類似於 20 世紀 60 年代運行 ELIZA 的電腦的模擬器。恢復程式碼後,該團隊於 12 月 21 日讓 ELIZA 運行起來,這是 60 年來的第一次。
「透過讓它運行,我們證明這實際上是 ELIZA 血統的一部分,而且它不僅有效,而且效果非常好,」Shrager 說。
但團隊還在程式碼中發現了一個錯誤,但他們選擇不修復該錯誤。 “這會破壞文物的真實性,”施雷格解釋道,“就像修復原版《蒙娜麗莎》中的錯誤筆畫一樣。”他們在研究中寫道,如果用戶輸入數字,例如“你今天是 999”,程式就會崩潰。
儘管它的初衷是成為人機通訊的研究平台,但「ELIZA 在當時還是一個新奇事物,以至於它的『聊天機器人』壓倒了它的研究目的,」Shrager 說。
有關的:
這項傳統至今仍在延續,因為 ELIZA 經常被與目前的大語言模型 (LLM) 和其他人工智慧進行比較。
儘管它無法與像 ChatGPT 這樣的現代法學碩士的能力相比,“當你考慮到它寫於 1965 年時,ELIZA 真的很了不起,”大衛貝瑞英國蘇塞克斯大學數位人文教授、論文的合著者在一封電子郵件中告訴《生活科學》。 “它可以在談話中保持一段時間。”
Shrager 說,ELIZA 比現代聊天機器人做得更好的一件事就是傾聽。現代法學碩士只會嘗試完成您的句子,而 ELIZA 則被編程為提示用戶繼續對話。施雷格說:“這更像是‘聊天’,而不是任何有意的聊天機器人。”
貝裡說:“讓 ELIZA 回歸,它是歷史上最著名(如果不是最著名的話)的聊天機器人之一,讓人們看到正在消失的歷史。”由於電腦科學領域是如此具有前瞻性,從業者往往認為它的歷史已經過時,並且不保留它。
不過,貝裡認為計算歷史也是文化歷史。
貝裡說:「作為一個社會,我們需要更加努力地工作,以保持計算時代新生的痕跡,因為如果我們不這樣做,我們就會失去蒙娜麗莎、米開朗基羅的大衛或雅典衛城的數位版本。