«明天的歷史學家將是一名程式設計師,否則他將不存在」。世界各地的檔案管理員和歷史學家已經開始使用工具人工智慧在他們的研究工作中。報告稱,這種用途才剛開始,必須謹慎處理麻省理工學院(和)技術評論,4月11日。多年來,大量歷史文獻被數位化的,有時數量非常大,例如19世紀的芬蘭司法檔案,或14至18世紀的巴黎聖母院檔案。但到目前為止,研究人員幾乎無法篩選這數百萬份文件。即使創建了電腦工具,他們也面臨兩個問題。首先,機器學習不能很好地分析古代插圖或銘文——例如來自中世紀或古代的插圖或銘文。
車 ”許多型號的IA使用過去十五年的資料集進行訓練”,里士滿大學人文學科教授勞倫·蒂爾頓解釋道。美國。他們學會列出和辨識的物件往往是當代生活的特色:iPhone 或特斯拉將很容易被識別,例如,人工智慧將偶然發現文藝復興時期代表的物體。就文本分析而言,同樣的故事。當生成式人工智慧擁有大量可以訓練的資料(例如英文文字)時,它會非常有效。但當涉及到書面文件時用一種死語言,甚至用接近拉丁語的方言幾乎所剩無幾,這種工具效率不高,因為它無法預先訓練。難度更大,因為古代手稿是手寫的,字體遠未標準化,因此人工智慧難以識別。
篡改歷史的風險
但最近,研究人員開發了允許人工智慧識別手寫、底線的程序對話4 月 14 日,關於一項旨在分析巴黎聖母院圖書館和檔案館手稿頁面的倡議。他們創建了模仿人腦的網路來發現大型複雜資料集中的模式。這些網路使得檢查歷史文獻成為可能,其中一些文獻已嚴重損壞。他們甚至可能在破解銘文或修復受損檔案方面發揮了作用。 DeepMind 研究員 Yannis Assael 和義大利威尼斯 Ca' Foscari 大學博士後學生 Thea Sommerschield 開發了一種深度神經網絡稱為伊薩卡。根據發表在《科學》雜誌上的描述,後者接受了近 78,000 個古代銘文的訓練,能夠重建缺失的部分,並將日期和地點歸因於文本。自然去年三月。另一項倡議:“威尼斯時光機» 旨在從檔案中重建這座城市的歷史。最終目標是創建中世紀威尼斯的數位版本。
但目前來看,該項目還遠遠未達到預期效果。因為有時,模型不會或會誤解他們所閱讀或分析的內容。然後他們會得出荒謬的結論,例如“幻覺» ChatGPT。它們也可能被濫用來創造深度贗品或偽造的古代銘文,講述從未存在過的情節。您可能在 YouTube 上看過理查德·尼克森 (Richard Nixon) 發表的一場演講,但那場演講從未發生過。寫下這段文字是為了防止 1969 年登月以災難告終——但事實並非如此。
深度造假背後的研究人員解釋說,人工智慧可能會影響我們的歷史常識。他們從 2020 年開始提出的建議在今天更加正確。因為幾個月以來,製作歷史事件的虛假照片,或者更確切地說,令人信服的古代銘文是每個人都能做到的。因此,麻省理工學院回憶道,用於填補記錄不全的時期或銘文缺失部分的人工智慧可能會犯錯誤,或被用來欺騙我們。歷史學家強調,雖然這些人工智慧系統可以成為有用的工具,但它們不僅必須透明地使用,而且必須謹慎使用:因為這些工具就像它們的創造者一樣:容易犯錯。
另請閱讀:《中途》為何禁止創作習近平形象
來源 : 麻省理工科技評論