如果我們中的一些人因為詐騙電話而不再接電話,這是可以理解的,因為越來越難以判斷電話另一端是否是真人。
Deepfake 檢測正在蓬勃發展,但 Gen AI 輔助的欺詐也在蓬勃發展,尋找無懈可擊的反 Deepfake 解決方案的努力仍在繼續。防禦性人工智能等工具可以提供幫助——儘管有些人認為是時候讓機器人聽起來更像機器人了。
“管理電話變得越來越具有挑戰性”:Hiya
總部位於西雅圖的語音安全服務提供商希亞發布了Hiya AI Phone,一款AI通話助手手機應用。一份新聞稿稱,該應用程序可以篩選電話,保護用戶免受詐騙,並在通話過程中做筆記。
該公司表示,其數據顯示,美國人每個月平均花費 40 分鐘來篩選 13 個不需要的垃圾電話。它還發現,到 2024 年,三分之一的美國人至少收到一份,其中 34% 的目標人平均損失 7,200 美元。
Hiya AI Phone的工作原理就像一個數字秘書:它接聽未知電話,要求來電者說出他們的姓名和目的,並評估是否將他們連接到你。其智能呼叫篩選可以檢測,持續實時分析通話音頻,並在發現潛在詐騙時發送警報。它還可以轉錄通話並做筆記。
“Hiya AI Phone 代表了人們與手機交互方式的突破性變革,”Hiya 首席執行官兼創始人 Alex Algard 表示。 “多年來,手機應用程序自在智能手機上推出以來一直停滯不前,幾乎沒有提供任何創新。Hiya AI Phone 的推出改變了這一狀況,推出了首款專門為應對當今充滿挑戰的通話環境而設計的通話助手——主要由、垃圾郵件、深度偽造詐騙和其他干擾。 ”
去年,Hiya 收購了 Loccus.ai,這是一家專門從事。此次收購使公司更名為 Hiya AI 語音檢測,並將 Deepfake 語音軟件集成到其 AI 應用程序中。
Hiya AI Phone 可供 Android 和 iPhone 用戶免費下載。
LG Uplus 的設備上深度偽造檢測將集成到 AI 代理中
LG Uplus 和是聯合起來應對音頻深度偽造威脅的公司之一。每日經濟新聞報告LG Uplus最近宣布開發“語音反欺騙(假語音辨別)”工具,可生成獨特的聲紋。它將在今年上半年集成到名為 Exio 的人工智能呼叫代理中。
LG 對安全性的貢獻在於該工具在“設備上環境中運行,不會單獨將語音信息傳輸到服務器”。它聲稱是“世界上第一個利用設備端技術開發和商業化語音反欺騙技術的公司。”
檢測能力意味著即使特定的人說話超出範圍,或者速度、重音、語氣不同,系統仍然有效。
LG Uplus 語音技術主管 Park Ji-woong 表示:“我們的人工智能即使在實時通話時也能檢測出假聲。”他聲稱准確率超過 95%。
Pindrop 脈衝活性檢測解決合成語音問題
與此同時,Pindrop 說出了標記的關鍵涉及包括活體檢測在內的分層方法。
一個博客文章該公司表示,生成對抗網絡(GAN)和自動編碼器等原始類型的合成語音技術很容易被認為是不自然的,但基於神經網絡的更先進的模型提出了更大的挑戰。
WaveNet,谷歌開發的一項技術深度思維,“使用神經網絡通過預測波形來產生高質量的語音。”文本轉語音 (TTS) 合成“將書面文本轉換為語音,同時調整速度、音調和音調等元素,使語音聽起來自然。”
針對 Deepfake 冒充的面向未來意味著“採用先進的並培育一種隨威脅形勢而發展的適應性和分層安全方法。 ”
音頻 Deepfake 檢測工具,多因素用於基於語音的系統(例如行為分析或基於設備的身份驗證)的 MFA,以及支持大規模近實時數據分析的基於雲的人工智能係統都可以幫助加強防禦。
想要解決 Deepfakes 問題嗎?將人工智能變成偏執的機器人
一些人說,這一切都很好——但如果我們要求人工智能聽起來像機器人,讓事情變得更容易,結果會怎樣呢?禁忌星球?
IEEE Spectrum 有一個文章“一種簡單的方法來識別誰或什麼正在與我們交談。”這篇文章認為“人工智能和機器人應該聽起來像機器人。”
“你不能只貼標籤”作家巴拉斯·拉加萬(Barath Raghavan)和布魯斯·施奈爾(Bruce Schneier)說道,“它會以多種不同的形式出現。因此,我們需要一種識別人工智能的方法,無論其形式如何,它都能發揮作用。它需要適用於長或短的音頻片段,甚至只有一秒長。它需要適用於任何語言、任何文化背景。與此同時,我們不應該限制底層系統的複雜性或語言的複雜性。 ”
他們的答案是什麼?一個環形調製器– 一種接收兩個音頻信號並將其處理為一個輸出信號以產生振盪聲音的設備。在數字音頻工作站出現之前,聲音設計師就是通過這種方式讓聲音聽起來像機器人一樣。認為戴立克斯來自經典神秘博士(使用 30 Hz 環形調製)。
他們說,強制將環形調製器應用於合成聲音,“計算簡單,可以實時應用,不會影響聲音的清晰度,而且最重要的是,由於其歷史上用於描繪機器人,所以它是普遍的‘機器人聲音’。”
“提供語音合成或任何形式都應添加某個標準頻率(例如,30-80 Hz 之間)和最小幅度(例如,20%)的環形調製器。就是這樣。人們很快就會明白。 ”
文章主題
||||||||||








