«明天的历史学家将是一名程序员,否则他将不存在”。世界各地的档案管理员和历史学家已经开始使用工具人工智能在他们的研究工作中。报告称,这种用途才刚刚开始,必须谨慎处理麻省理工学院(和)技术评论,4月11日。多年来,大量历史文献被数字化的,有时数量非常大,例如19世纪的芬兰司法档案,或14至18世纪的巴黎圣母院档案。但到目前为止,研究人员几乎无法筛选这数百万份文档。即使创建了计算机工具,他们也面临两个问题。首先,机器学习不能很好地分析古代插图或铭文——例如来自中世纪或古代的插图或铭文。
车 ”许多型号的IA使用过去十五年的数据集进行训练”,里士满大学人文学科教授劳伦·蒂尔顿解释道。美国。他们学会列出和识别的对象往往是当代生活的特点:iPhone 或特斯拉将很容易被识别,例如,人工智能将偶然发现文艺复兴时期代表的物体。就文本分析而言,同样的故事。当生成式人工智能拥有大量可以训练的数据(例如英文文本)时,它会非常有效。但当涉及到书面文件时用一种死语言,甚至用一种接近拉丁语的方言几乎所剩无几,这种工具效率不高,因为它无法预先训练。难度更大,因为古代手稿是手写的,字体远未标准化,因此人工智能难以识别。
篡改历史的风险
但最近,研究人员开发了允许人工智能识别手写、下划线的程序对话4 月 14 日,关于一项旨在分析巴黎圣母院图书馆和档案馆手稿页面的倡议。他们创建了模仿人脑的网络来发现大型复杂数据集中的模式。这些网络使得检查历史文献成为可能,其中一些文献已严重损坏。他们甚至可能在破译铭文或修复受损档案方面发挥了作用。 DeepMind 研究员 Yannis Assael 和意大利威尼斯 Ca' Foscari 大学博士后学生 Thea Sommerschield 开发了一种深度神经网络称为伊萨卡。根据发表在《科学》杂志上的描述,后者接受了近 78,000 个古代铭文的训练,能够重建缺失的部分,并将日期和地点归因于文本。自然去年三月。另一项倡议:“威尼斯时光机» 旨在从档案中重建这座城市的历史。最终目标是创建中世纪威尼斯的数字版本。
但目前来看,该项目还远未达到预期效果。因为有时,模型不会或会误解他们所读取或分析的内容。然后他们会得出荒谬的结论,比如“幻觉» ChatGPT。它们还可能被滥用来创建深度赝品或伪造的古代铭文,讲述从未存在过的情节。您可能在 YouTube 上看过理查德·尼克松 (Richard Nixon) 发表的一场演讲,但那场演讲从未发生过。写下这段文字是为了防止 1969 年登月以灾难告终——但事实并非如此。
深度造假背后的研究人员解释说,人工智能可能会影响我们的历史常识。他们从 2020 年开始提出的建议在今天更加正确。因为几个月以来,制作历史事件的虚假照片,或者更确切地说,令人信服的古代铭文是每个人都能做到的。因此,麻省理工学院回忆道,用于填补记录不全的时期或铭文缺失部分的人工智能可能会犯错误,或者被用来欺骗我们。历史学家强调,虽然这些人工智能系统可以成为有用的工具,但它们不仅必须透明地使用,而且必须谨慎使用:因为这些工具就像它们的创造者一样:容易犯错。
另请阅读:《中途》为何禁止创作习近平形象
来源 : 麻省理工科技评论