人工智能產生的圖像一直在互聯網上迅速傳播,引發了人們對身份欺詐,虛假信息等。但是在生物識別行業中,合成數據是被譽為解決方案由於缺乏用於AI培訓的數據,圍繞數據隱私限制以及與偏見作鬥爭。
亞馬遜一人正在使用生成的AI創建“棕櫚工廠”,並生產數百萬個棕櫚的合成圖像來訓練其AI模型。
亞馬遜副總裁兼傑出的科學家杰拉德·梅迪奧尼(Gerard Medioni)表示,Palm Biometrics支付服務依靠合成數據來增加數據集的規模及其多樣性,以提高系統的準確性。
“主要的挑戰是沒有適當的數據。我們如何訓練我們需要大量數據的深層網絡?我們通過創建合成數據做到了這一點。” Medioni在影片最近由電子商務巨頭出版。
AI生成的手可以包括許多微妙的變化,例如不同的亮度條件,手姿勢以及創可貼,結婚戒指或傷疤的存在。圖像也可以自動“註釋”,縮短手動標記圖片的艱辛過程,以便計算機可以識別他們在看的內容。亞馬遜一人還訓練了其係統以檢測假手,包括詳細的複製品。
亞馬遜科學家面臨的挑戰是在創造了這一集的許多變化的同時,保留了身份。這稱為可控生成型AI。
梅迪奧尼說:“我們用它來訓練我們的系統,並且我們獲得的精度比面部識別高1000倍,而兩個虹膜的準確性高100倍。”
雜貨店連鎖Whole Foods為美國的200個地點提供亞馬遜,併計劃裝備500多家商店在2023年底之前,棕櫚生物識別付款。該公司計劃將棕櫚付款擴展到付款中,並與Panera和Coors Field等客戶進行年齡驗證。
綜合數據 - 解決數據隱私限制的解決方案?
使用合成數據的通常論點是真實數據太少,增加了數據的多樣性,或者收集過於不切實際或過於昂貴的數據。但是有新的理由應用AI生成的生物識別數據。
創新認為即將到來的歐盟AI法案可能會使生物識別數據的收集和處理更加複雜。使用合成數據進行培訓可能會解決這一挑戰。
Innovatrics Image Image Synthesis團隊負責人Igor Janos說:“對於我們來說,作為機器學習從業人員,實際使用真實數據將變得越來越困難。” “隨著綜合數據的採用,我們希望找到圍繞這些限制的方法。”
Innovatrics的Janos在由Google DeepMind在斯洛伐克Kosice組織的東歐機器學習暑期學校講話證明它使用生成的數據來改進算法。
歐盟AI法案計劃將生物識別AI系統分類為高風險風險,這將要求公司滿足數據處理和保護的某些要求。 AI ACT還可以在某些技術上引入禁令,以收集數據,例如從社交媒體,YouTube和其他在線資源中刮擦圖像。
Janos指出,合成數據允許公司解決隱私問題,因為無需控制誰可以訪問真實數據或洩漏和暴露的疑慮。
該公司在上週的一份新聞稿中說,Innovatrics還一直在使用合成指紋片段來改善用於檢測犯罪現場指紋的算法。