「停止偷我們的書，付錢給我們」：在美國，作家面對人工智慧製造商的野馬

在美國，作家們要求人工智慧製造商停止竊取他們的書籍來訓練他們的人工智慧。他們要求賠償，並要求他們獲得未來培訓的許可。在歐洲，代表創意產業的協會也呼籲人工智慧公司承擔透明度義務。對後者來說，版權和人工智慧創新並非不相容。

這是在美國和歐洲在幾個小時內發生的兩項舉措，並且具有相同的目標：要求開放人工智慧、Google、Meta 和所有其他開發者人工智慧他們尊重版權當他們訓練人工智慧工具時。大西洋彼岸，9000多名作家在專業作家組織作家協會網站上發表的一封信上簽名。他們的要求很簡單：人工智慧必須停止在沒有絲毫授權、沒有絲毫經濟補償的情況下對其作品進行訓練。 “這些技術模仿並反省我們的語言、我們的故事、我們的風格和我們的想法。數以百萬計的受版權保護的書籍、文章、散文和詩歌構成了人工智慧系統的“食物”，無窮無盡的免費餐食»，他們寫道。

24小時後，有代表，在歐洲，7 月 19 日，作者組織、圖書、圖像、媒體甚至音樂產業的人士呼籲人工智慧產業尊重版權。因為 ”人工智慧創新的進步和有效的版權保護並不互相排斥»，他們懇求道。他們也捍衛了在訓練人工智慧系統方面施加透明度義務的想法。歐洲議會希望在該框架內增加這方面的規定人工智慧監管。這項未來的法律目前正在歐盟內通過，將成為監管該行業的首批文本之一。

另請閱讀：電影：配音界如何試圖阻止人工智慧的“掠奪”

ChatGPT 可以複製大作家的風格

大西洋兩岸的創作者都對人工智慧在他們的作品中被愉快地使用來餵養他們的語言模型感到遺憾。聊天GPT，詩人因此，LLaMa 將能夠以瑪格麗特·阿特伍德 (Magaret Atwood) 或卡門·馬查多 (Carmen Machado) 等作家的風格撰寫文本，包括整本書。這怎麼可能？ OpenAI、微軟、Meta 或Google等製造商很少透露他們如何選擇用於訓練人工智慧的資料。例如，OpenAI 在一份新聞稿中宣稱，ChatGPT 是由「授權內容、公開內容以及人工智慧培訓師和使用者創建的內容»，並補充說公司尊重創作者和作者的權利。但目前還沒有這些數據的清單。我們知道所有人工智慧開發人員都大量使用來自網路的數據。

然而，其中一些資料受版權保護。具體來說，這就是這 9,000 名作者這封信的全部目的，人工智慧開發者並沒有向出版商乞求用戶許可——如果他們想要正確地做事，通常會發生這種情況。因此，只有兩種可能性：要么人工智慧是根據作品摘錄進行訓練的，有時可以在網站或書店和圖書館找到。要么是語言模型下載了非法資料庫，其中有很多文本。

「誰會故意竊取數百萬件作品來推動新的商業產品？ »

也正是基於此，作家兼演員 Sarah Silverman 於 7 月初向美國法院起訴 Meta 和 OpenAI。對於後者，聊天GPT和 LLaMa 接受了有關非法包含版權作品的盜版網站內容的部分培訓。人工智慧公司，“正在花費數十億美元開發人工智慧技術”，因此必須“補償我們使用我們的著作，否則人工智慧將變得平庸且極其有限», 估計這封信的簽署人。和 ”誰會故意竊取數百萬作品來推動新的商業產品？»，他們問道，毫不猶豫地限定 OpenAI 和 Meta “惡意行為者»。

另請閱讀：安迪沃荷版權案如何撼動生成人工智慧

因為所謂的偷竊行為對於一個在人工智慧興起之前就已經靠藝術謀生的職業來說是災難性的，除了少數明星之外。 “這種情況是站不住腳的，尤其是對於年輕作家和來自代表性不足的社區的聲音而言»，對這封信的作者感到遺憾。 “透過將我們的著作整合到您的系統中，產生人工智慧可能會損害我們的職業，因為市場上充斥著由機器編寫並基於我們工作的平庸書籍、故事（…）»，他們繼續。作為證明：「最近，一些品質非常差的人工智慧生成的書籍登上了亞馬遜的暢銷書排行榜（…）；出版商被生成的作品淹沒»。

暫時沒有採取法律行動的論壇

在信中，作者提出了幾項要求。他們要求人工智慧開發者從現在開始獲得每個權利人的許可，才能使用作品作為訓練資料。對於已經被人工智慧攝取的作品，作者要求獲得經濟補償，不僅包括培訓部分，還包括人工智慧以相關作家的風格生成的所有內容。目前，這只是一封公開信，沒有採取法律行動，向我們的同事解釋說美國國家公共電台作者協會執行長瑪麗·拉森伯格 (Mary Rasenberger) 談到了此類程序所需的巨大成本和極其漫長的時間。

此次論壇是否會對業界的企業產生絲毫影響，還有待觀察。 “誰會願意說，是的，我們的人工智慧是建立在被盜作品的基礎上的，我們很抱歉，我們會為此付出代價»，詢問我們的同事TechCrunch，誰似乎都不太相信。目前，受版權保護或受版權保護的作品的使用仍處於灰色地帶。在美國和歐洲，法院尚未直接就這一問題做出裁決，但預計他們很快就會做出裁決，並採取行動。

整個問題是人工智慧巨頭是否有權使用網路上的這些資料（包括受版權保護的資料）來訓練他們的人工智慧。在美國，不存在“資料探勘例外”，而在歐盟，如果作者沒有反對，則授權此類使用。但企業依賴一種叫做合理使用»，合理使用，版權壟斷的例外，以證明將受保護作品納入人工智慧訓練資料的合理性。在等待法院裁決的同時，立法者可以利用他們正在製定的人工智慧法規來最終解決這個問題。