回到人工智能上升時,AI刮擦是一個巨大的問題,因為它們沒有許可,並且沒有要求正確的權限從Web來源訪問數據,而同樣的問題就是什麼基金會現在正面臨。
該非營利組織現在正在抱怨其網站上臭名昭著的AI刮擦案件,該案例現在正在對服務器產生巨大的壓力。
Wikimedia抱怨AI機器人刮擦,使其服務器緊張
Wikimedia基金會分享帖子哪個詳細介紹了大規模的AI刮擦活動如何對其可用的不同網站的運營產生負面影響。該組織稱,從其平台上刮擦數據的AI機器人已經給服務器帶來了重大壓力,儘管許多有機用戶仍然前往其網站以獲取信息,但機器人卻佔多數。
該基金會說:“但是隨著人工智能的興起,動態正在發生變化:我們觀察到請求量的大幅增加,大部分流量都是由刮擦機器人收集大型語言模型(LLMS)和其他用例的培訓數據所驅動的。”
總體而言,Wikimedia聲稱自2024年1月以來,下載內容的帶寬飆升了50%。從其網站上刮下的AI機器人一直在消耗數據的數據。ARS Technica。
無限制的AI刮擦的巨大影響
人們擔心AI公司將進入特定平台,網站及其後端,以收集他們將用於培訓模型的數據和信息。 Openai是最臭名昭著的人之一,因為他們面臨來自不同原告的大規模訴訟,,,,,,,,,科技公司,以及更多用於人工智能刮擦。
但是,山姆·奧特曼(Sam Altman)和Openai並不是唯一據稱正在從網絡上刮取數據的人,並且在沒有許可或許可的情況下這樣做是自從生成AI的時代開始以來的一種臭名昭著的做法。
版權侵權是未經授權的AI刮擦的最重要影響之一,但這也是隱私問題,尤其是在Meta之類的平台上,收穫的平台為他們的AI模型。
其他公司希望利用其大量數據從AI刮刀中獲利,與AI公司合作,以許可其數據,例如Reddit去年推出的數據,Google是其最大的客戶之一。