中国对谷歌的回答可以在听到它的几秒钟内克隆你的声音

2018-03-03

（停留/iStock）

中国的谷歌百度刚刚发布了白皮书展示其最新发展人工智能(AI)：一种可以使用神经网络在分析长达数秒的剪辑后克隆声音的程序。

该软件不仅可以模仿输入的声音，还可以改变它以反映另一种性别，甚至不同的口音。

你可以听一些此处生成的示例，托管在 GitHub 上。

该技术的先前迭代允许在系统分析较长的语音样本后进行语音克隆。 2017年，百度深度语音研究团队推出可克隆语音的技术含 30 分钟的培训材料。

Adobe 有一个名为 VoCo 的程序，它可以用 20 分钟的音频来模仿声音。一家加拿大初创公司名为琴鸟，可以克隆只有一分钟音频的声音。

百度的创新进一步将这个时间缩短到了几秒钟。

虽然乍一看这似乎是对 90 年代流行的技术的升级，但在《小鬼当家 2》和《惊声尖叫》系列的帮助下，这项技术实际上有一些高贵的应用。

例如：想象一下，当您在很远的地方时，有人用您的声音给您的孩子读书，或者为失去说话能力的人创建一个重复的声音。

这项技术还可用于创建个性化数字助理和听起来更自然的语音翻译服务。

然而，与许多技术一样，语音克隆也存在被滥用的风险。

新科学家报告该程序能够产生一种声音来欺骗语音识别软件，在测试中准确率超过 95%。

人类甚至给克隆声音打了 3.16 分（满分 4 分）。这可能会开启以下可能性：人工智能辅助欺诈。

存在可以使用人工智能来替换或改变的程序——甚至从头开始生成– 视频中人物的面孔。目前，这主要在互联网上使用，通过将尼古拉斯·凯奇插入其中来带来笑声。指环王系列。

但加上可以克隆声音的技术，我们很快就会受到轰炸更多“假新闻”政客做出不寻常的行为或说出他们不会说的话。

仅使用书面文字或 Photoshop 就可以很容易地愚弄很多人；如果这些技术落入坏人之手，可能会带来更多麻烦。

本文最初发表于未来主义。阅读原创文章。