科学家们刚刚从失传已久的计算机代码中复活了世界上第一个聊天机器人“ELIZA”——而且它仍然效果非常好。
这些“软件考古学家”利用麻省理工学院档案中布满灰尘的打印输出,发现了丢失 60 年的失效代码,并将其复活。
ELIZA 是 20 世纪 60 年代由 MIT 教授开发的约瑟夫·魏森鲍姆并以戏剧《皮格马利翁》的主角伊丽莎·杜利特尔 (Eliza Doolittle) 的名字命名,她被教导如何像英国贵族女性一样说话。
作为用户可以交互的语言模型,ELIZA 对当今的(人工智能),研究人员在预印本数据库上发布的一篇论文中写道arXiv周日(1 月 12 日)。为 ELIZA 编写的“DOCTOR”脚本被编程为像心理治疗师一样回答问题。为了例子,ELIZA 会说,“请告诉我你的问题。”如果用户输入“男人都是相似的”,程序就会回答“以什么方式”。
Weizenbaum 使用他发明的一种现已废弃的编程语言编写了 ELIZA,该语言称为密歇根算法解码器对称列表处理器 (MAD-SLIP),但它几乎立即被复制到 Lisp 语言中。随着早期互联网的出现,ELIZA 的 Lisp 版本迅速流行,原始版本已经过时。
有关的:
专家认为原始的 420 行 ELIZA 代码直到 2021 年才丢失,当时该研究的合著者杰夫·施雷格,斯坦福大学的认知科学家,以及迈尔斯·克劳利麻省理工学院档案管理员在其中发现了它魏岑鲍姆的论文。
“我对早期人工智能先驱的想法特别感兴趣,”施雷格在一封电子邮件中告诉《生活科学》。 “拥有计算机科学家的代码就相当于记录了他们的想法,而 ELIZA 曾经是并且仍然是早期人工智能的试金石,无论好坏,我想知道他的想法是什么。”但他说,团队想让 ELIZA 发挥作用的原因更为复杂。
“从技术角度来看,我们甚至不知道我们发现的代码——迄今为止发现的唯一版本——实际上有效,”施拉格说。所以他们意识到他们必须尝试一下。
复活伊丽莎
让 ELIZA 起死回生并不容易。它要求团队清理和调试代码,并创建一个类似于 20 世纪 60 年代运行 ELIZA 的计算机的模拟器。恢复代码后,该团队于 12 月 21 日让 ELIZA 运行起来,这是 60 年来的第一次。
“通过让它运行,我们证明这实际上是 ELIZA 血统的一部分,而且它不仅有效,而且效果非常好,”Shrager 说。
但团队还在代码中发现了一个错误,但他们选择不修复该错误。 “这会破坏文物的真实性,”施雷格解释道,“就像修复原版《蒙娜丽莎》中的错误笔画一样。”他们在研究中写道,如果用户输入一个数字,例如“你今天是 999”,程序就会崩溃。
尽管它的初衷是成为人机通信的研究平台,但“ELIZA 在当时还是一个新奇事物,以至于它的‘聊天机器人’压倒了它的研究目的,”Shrager 说。
有关的:
这一传统至今仍在延续,因为 ELIZA 经常被与当前的大语言模型 (LLM) 和其他人工智能进行比较。
尽管它无法与像 ChatGPT 这样的现代法学硕士的能力相比,“当你考虑到它写于 1965 年时,ELIZA 真的很了不起,”大卫·贝瑞英国苏塞克斯大学数字人文教授、该论文的合著者在一封电子邮件中告诉《生活科学》。 “它可以在谈话中保持一段时间。”
Shrager 说,ELIZA 比现代聊天机器人做得更好的一件事就是倾听。现代法学硕士只会尝试完成您的句子,而 ELIZA 则被编程为提示用户继续对话。施雷格说:“这更像是‘聊天’,而不是任何有意的聊天机器人。”
贝里说:“让 ELIZA 回归,它是历史上最著名(如果不是最著名的话)的聊天机器人之一,让人们看到正在消失的历史。”由于计算机科学领域是如此具有前瞻性,从业者往往认为它的历史已经过时,并且不保留它。
不过,贝里认为计算历史也是文化历史。
贝里说:“作为一个社会,我们需要更加努力地工作,以保持计算时代新生的痕迹,因为如果我们不这样做,我们就会失去蒙娜丽莎、米开朗基罗的大卫或雅典卫城的数字版本。” ”。