安全供应商说，现在需要快速采取行动

2023-05-22

一个新研究报告从安全分析师记录的未来供应商中说，语音克隆能够在野外击败语音多因素身份验证。该报告的作者说，需要采用跨行业的方法来控制深层声音。

报告“我没有嘴，我必须犯罪”，是对科幻作者的致敬哈兰·埃里森（Harlan Ellison）的黑暗幻象，但其发现包含有保证诗意的繁荣。

报告指出：“语音克隆技术目前正在野外滥用威胁行为者。”它正在“实现错误信息和虚假信息的传播，并提高社会工程学的有效性”。进入进入的障碍继续变得较低，平台等平台Elevenlabs流行的Prime语音AI提供低成本，基于浏览器的文本到语音（TTS）转换的选项。

报告说：“语音克隆样本，例如名人，政客和互联网人物的样本（'有影响力的人'），并旨在创建喜剧或恶意内容，这些内容通常是种族主义，歧视性或暴力的。”威胁行为者正在证明有效基于语音的欺诈攻击包括语音网络钓鱼或钓鱼。

对于Microsoft的TTS AI模型vall-e等平台，它仅需要三秒钟音频能够产生一个克隆的声音，例如，亲人要求保释金。

目前，技术限制意味着语音克隆主要用于小规模欺诈，并利用一次性样本进行勒索或虚假信息。尽管如此，结果对于个人而言可能是灾难性的。本月，加拿大广播公司CBC报告在语音克隆上，用来欺骗纽芬兰的八名老年人的$ 200,000（148,000美元）。受害者接到电话，在此期间，克隆的孙子的声音要求他们赚钱以支付紧急费用。

在其他实例，克隆的声音已用于绑架和人质骗局。

报告调查了深网chat不休，发现某些威胁行为者并不相信当前的语音克隆技术可以应对某些安全障碍，尤其是在克隆非英语的声音时。但是他们已经在寻找修改它的方法。这样的解决方法之一就是语音克隆作为服务或VCAA。报告称，这是“一种新的商品化网络犯罪形式，在其中语音克隆的“专家”提供了量身定制的语音克隆样本，经常通过电报宣传他们的服务。”

此外，公众对AI的普遍提高导致了免费的匿名第三方人数的激增语音克隆服务。开源语音克隆软件正在社交媒体和代码存储库中出现。网络犯罪分子正试图寻找方法来规避诸如Elevenlabs之类的平台所施加的内容限制，当它更新其社区标准以阻止语音克隆以确定出于邪恶目的而引起海报的愤怒。

该报告建议组织在解决与语音克隆相关的风险时尽早采取行动，这些风险正在增长。 “要立即采用行业范围的方法，以便从语音克隆技术的未来进步中提高进一步的威胁。”