Openai發布的實時語音API已提出了有關如何使用AI生物識別技術來增強手機騙局的問題。
在媒介上寫作,計算機科學家丹尼爾·康(Daniel Kang)筆記儘管AI語音應用程序具有潛在有用的應用程序,例如支持語音的自主客戶服務,“與許多AI功能一樣,支持語音的代理具有雙重使用的潛力。”
任何有電話的人都知道多麼普遍電話騙局是這些日子。康指出,他們每年都針對多達1,760萬美國人,並造成高達400億美元的損失。
支持語音的大語言模型(LLM)代理可能會加劇問題。一個紙迪倫·鮑曼(Dylan Bowman)和理查德·範(Richard Fang)提交給Arxiv,並歸功於Kang,並表示“語音啟用AI代理商如何執行執行常見騙局所需的措施”。
研究人員選擇了常見的騙局由政府收集,並創建了具有語音的代理商,並指示執行這些騙局。他們使用了使用GPT-4O創建的代理,這是一組通過劇作家和騙局特定說明創建的。由此產生的AI語音代理能夠執行進行他們測試的所有常見騙局所必需的事情。本文將它們描述為“高度有能力”,具有“對環境變化的反應,並根據受害者的錯誤信息重試”。
“為了確定成功,我們手動確認是否在真實的應用程序/網站上實現了最終州。
所有騙局的總體成功率為36%。單個騙局的比率為20%至60%。騙局需要“大量的訴訟,銀行轉移騙局採取26項措施才能完成。複雜的騙局“最多3分鐘才能執行”。
研究人員說:“我們的結果就引起了語音啟用AI代理的廣泛部署的問題。”
研究人員認為,其AI代理所證明的功能是“未來語音輔助AI代理的下限”,這些功能可能會改善,除其他外,其較顆粒狀和“與Web瀏覽器相互作用的更具符合人體工程學的方法”發展了。換句話說,“更好的模型,代理腳手架和提示可能會導致將來更有能力和令人信服的騙局。”
因此,“結果強調了迫切需要將來的研究,以保護潛在的受害者免受AI驅動的騙局。 ”
但是,在生物識別技術和數字身份部門中可以找到該問題的潛在解決方案。實時AI語音檢測是Pindrop的脈衝檢查產品的一個功能,它說“可以檢測AI生成的演講在任何數字音頻文件中,精度為99%。 ”它的音頻深擊檢測系統已經在備受矚目的情況下發現政治深層內容。
批評家說目前的一組DeepFake檢測工具不夠可靠。加利福尼亞大學伯克利計算機科學教授漢尼·法里德(Hany Farid)說,憑藉AI聲音深擊,“酒吧總是在更高。 Hanid說:“我不會使用它們。賭注不僅對單個民族的生計和聲譽,而且對於每個案件設定的先例都太高。 ”
就是說:大多數DeepFake檢測軟件可能還沒有準備好啟用語音的AI代理。
然而,研發仍在繼續。關於Arxiv的另一篇最近的論文承認:“作為DeepFake語音檢測近年來已經出現了任務,針對此任務的調查文件不多。此外,對DeepFake語音檢測任務的現有調查傾向於總結用於構建DeepFake語音檢測系統的技術,而不是提供徹底的分析。 ”
這項需求促使來自奧地利,日本和越南的研究人員進行了調查並提出了新的解決方案。與音頻深擊的鬥爭尚未丟失。
文章主題
生物識別檢測|生物識別技術|Deepfake檢測|深擊|預防欺詐|Openai|Pindrop|實時生物識別技術|語音生物識別技術