病歷照片是私人的,但這可能不會阻止它們出現在用於培訓人工智能(AI)和生物識別系統的數據集中ARS Technica。
與AI合作的加利福尼亞藝術家震驚地發現Laion-5b,一個數據集從網絡上的公開圖像中刮掉,其中包含了她的兩張近十年前拍攝的她的兩張後醫療照片。這位自稱為打衣的藝術家說,這些照片是按照治療血症症狀的程序拍攝的,康涅狄格州康格納尼塔(Congenita)是一種遺傳疾病,抑制了骨髓中的血細胞產生。
簽名的釋放打衣發表在Twitter上清楚地表明,她不同意在病歷以外的任何地方使用的照片。拍攝照片的外科醫生於2018年去世。但是有一件事是可以肯定的:它們不是其中唯一的敏感生物特徵數據。 ARS Technica進行了搜索,以確認Laion-5B中確實存在Lapine的照片,並發現“數據集中的數千張類似的患者病歷照片,每張照片可能具有相似的可疑道德或法律地位。”此外,其中許多可能已經集成到商業AI圖像合成服務中,並用於訓練面部識別算法。
Laion是一個非營利組織,“旨在為公眾提供大規模的機器學習模型,數據集和相關代碼。”換句話說,其數據集由原始圖像的URL列表組成。所以,雖然它網站確實有簡短的說明,說明歐盟公民如何在特定方案(例如,鏈接圖像和名稱鏈接時),Laion實際上並未在其數據集中託管圖像。當Lapine向Laion的Discord Server發布了有關她的問題的問題時,該組織的一名工程師建議她要求將其刪除為源頭 - 即,Laion的錯並不是她的照片在那裡被刮掉。
就拉皮恩而言,她仍然希望她的照片從Laion 5-B上刪除,並與AI一起暫停了她的工作,目前是引用道德問題關於什麼(或誰)可能最終出現在其中。她說:“僅僅因為他們從網絡上刮掉了它並不意味著它應該是公共信息。” “甚至在網上。”
這一發現是在算法觀察到的幾週後發現了跨性別者的面部識別數據集在線可用幾年在其存在的最初爭議之後。