如果我们中的一些人因为诈骗电话而不再接电话,这是可以理解的,因为越来越难以判断电话另一端是否是真人。
Deepfake 检测正在蓬勃发展,但 Gen AI 辅助的欺诈也在蓬勃发展,寻找无懈可击的反 Deepfake 解决方案的努力仍在继续。防御性人工智能等工具可以提供帮助——尽管有些人认为是时候让机器人听起来更像机器人了。
“管理电话变得越来越具有挑战性”:Hiya
总部位于西雅图的语音安全服务提供商希亚发布了Hiya AI Phone,一款AI通话助手手机应用。一份新闻稿称,该应用程序可以筛选电话,保护用户免受诈骗,并在通话过程中做笔记。
该公司表示,其数据显示,美国人每个月平均花费 40 分钟来筛选 13 个不需要的垃圾电话。它还发现,到 2024 年,三分之一的美国人至少收到一份,其中 34% 的目标人平均损失 7,200 美元。
Hiya AI Phone的工作原理就像一个数字秘书:它接听未知电话,要求来电者说出他们的姓名和目的,并评估是否将他们连接到你。其智能呼叫筛选可以检测,持续实时分析通话音频,并在发现潜在诈骗时发送警报。它还可以转录通话并做笔记。
“Hiya AI Phone 代表了人们与手机交互方式的突破性变革,”Hiya 首席执行官兼创始人 Alex Algard 表示。 “多年来,手机应用程序自在智能手机上推出以来一直停滞不前,几乎没有提供任何创新。Hiya AI Phone 的推出改变了这一状况,推出了首款专门为应对当今充满挑战的通话环境而设计的通话助手——主要由、垃圾邮件、深度伪造诈骗和其他干扰。”
去年,Hiya 收购了 Loccus.ai,这是一家专门从事。此次收购使公司更名为 Hiya AI 语音检测,并将 Deepfake 语音软件集成到其 AI 应用程序中。
Hiya AI Phone 可供 Android 和 iPhone 用户免费下载。
LG Uplus 的设备上深度伪造检测将集成到 AI 代理中
LG Uplus 和是联合起来应对音频深度伪造威胁的公司之一。每日经济新闻报告LG Uplus最近宣布开发“语音反欺骗(假语音辨别)”工具,可生成独特的声纹。它将在今年上半年集成到名为 Exio 的人工智能呼叫代理中。
LG 对安全性的贡献在于该工具在“设备上环境中运行,不会单独将语音信息传输到服务器”。它声称是“世界上第一个利用设备端技术开发和商业化语音反欺骗技术的公司。”
检测能力意味着即使特定的人说话超出范围,或者速度、重音、语气不同,系统仍然有效。
LG Uplus 语音技术主管 Park Ji-woong 表示:“我们的人工智能即使在实时通话时也能检测出假声。”他声称准确率超过 95%。
Pindrop 脉冲活性检测解决合成语音问题
与此同时,Pindrop 说出了标记的关键涉及包括活体检测在内的分层方法。
一个博客文章该公司表示,生成对抗网络(GAN)和自动编码器等原始类型的合成语音技术很容易被认为是不自然的,但基于神经网络的更先进的模型提出了更大的挑战。
WaveNet,谷歌开发的一项技术深度思维,“使用神经网络通过预测波形来产生高质量的语音。”文本转语音 (TTS) 合成“将书面文本转换为语音,同时调整速度、音调和音调等元素,使语音听起来自然。”
针对 Deepfake 冒充的面向未来意味着“采用先进的并培育一种随威胁形势而发展的适应性和分层安全方法。”
音频 Deepfake 检测工具,多因素用于基于语音的系统(例如行为分析或基于设备的身份验证)的 MFA,以及支持大规模近实时数据分析的基于云的人工智能系统都可以帮助加强防御。
想要解决 Deepfakes 问题吗?将人工智能变成偏执的机器人
一些人说,这一切都很好——但如果我们要求人工智能听起来像机器人,让事情变得更容易,结果会怎样呢?禁忌星球?
IEEE Spectrum 有一个文章“一种简单的方法来识别谁或什么正在与我们交谈。”这篇文章认为“人工智能和机器人应该听起来像机器人。”
“你不能只贴标签”作家巴拉斯·拉加万(Barath Raghavan)和布鲁斯·施奈尔(Bruce Schneier)说道,“它会以多种不同的形式出现。因此,我们需要一种识别人工智能的方法,无论其形式如何,它都能发挥作用。它需要适用于长或短的音频片段,甚至只有一秒长。它需要适用于任何语言、任何文化背景。与此同时,我们不应该限制底层系统的复杂性或语言的复杂性。”
他们的答案是什么?一个环形调制器– 一种接收两个音频信号并将其处理为一个输出信号以产生振荡声音的设备。在数字音频工作站出现之前,声音设计师就是通过这种方式让声音听起来像机器人一样。认为戴立克斯来自经典神秘博士(使用 30 Hz 环形调制)。
他们说,强制将环形调制器应用于合成声音,“计算简单,可以实时应用,不会影响声音的清晰度,而且最重要的是,由于其历史上用于描绘机器人,所以它是普遍的‘机器人声音’。”
“提供语音合成或任何形式都应添加某个标准频率(例如,30-80 Hz 之间)和最小幅度(例如,20%)的环形调制器。就是这样。人们很快就会明白。”
文章主题
||||||||||









