在一千晚的瓶子里的精灵的原始故事中,精灵威胁要杀死释放他的渔夫 - 这个故事似乎引起了共鸣Openai,随着它继续追求先进的语音克隆和合成音频和视频工具,它带有主要风险。
在博客文章该公司表示,测试的结果表明,其语音引擎非常擅长DeepFake语音克隆和合成音频,因此几乎可以肯定会在广泛发布时被滥用,这促使ChatGpt Maker稍微放弃设置产品,直到建立更强大的规则和更强大的规则和部署指南。
语音引擎于2022年开发,是对Open AI的文本到语音API中已经使用的技术的更新和对话模式chatgpt。博客说,语音引擎“使用文本输入和单个15秒的音频样本来生成与原始扬声器非常相似的自然语音。值得注意的是,具有单个15秒样本的小型模型可以创造出情感和现实的声音。”该公司尚未透露用于训练语音引擎的情感丰富数据的来源,但告诉TechCrunch该模型“经过了有执照且可公开的数据的组合培训”。
也许开始了解一种免费,易于访问的工具的全面含义,该工具可以重新创建其具有15秒样本的任何人的逼真的声音,该公司现在说,它正在“采取谨慎而明智的方法来进行更广泛的释放,这是由于潜在的潜力综合语音滥用。”
博客文章说:“我们希望开始就合成声音负责部署以及社会如何适应这些新功能的对话。” “基于这些对话和这些小型测试的结果,我们将对是否以及如何按大规模部署这项技术做出更明智的决定。”
根据Arstechnica的报告条款和条件对于测试语音引擎的公司,禁止“无同意或法律权利”对个人或组织的模仿。他们要求明确披露使用AI来克隆声音的使用,并告知任何被克隆的人的同意。另外,打开AI使用水印,使使用语音引擎产生的音频更容易。
尽管如此,该公司清楚地表明,停止生成的AI速度列车不是一种选择,并且可以通过社会来改变时代。 “我们希望语音引擎的预览既强调了它的潜力生成模型它说。首先,它建议将语音身份验证作为银行业和其他敏感用例的ID验证的一种手段,从而增加了对AI的公共教育,“探索“探索保护在AI中使用个人声音的政策”,并加速Livices检测,水印和其他工具,以将真实的声音与综合声音区分开来。
值得一提面部识别软件及其文本到视频API Sora如此惊人,以至于被定位以改变世界。