继文本(ChatGPT)和图像(Dall-E)之后,OpenAI 正在处理视频!该公司推出了 Sora,这是一种新的人工智能模型,可通过简单的文本查询创建逼真的视频。第一个结果是令人不安的现实。
OpenAI 不想停留在图像或文本上。 ChatGPT 的创建者 Sora 正在向视频发起进攻。这种“文本到视频”的人工智能模型可以生成一分钟的剪辑同时始终保持视觉质量。
一分钟视频的逼真品质
已经有视频的人工智能模型,例如谷歌的 Runway,但生成的剪辑不会超过几秒钟。因此,Sora 走得更远,最重要的是,所生成图像的逼真质量令人惊讶。 OpenAI 的老板 Sam Altman 根据互联网用户的要求分享了其中的几项创作,并在该公司的网站上分享了一些内容。提出有几个同样令人惊讶。
https://twitter.com/sama/status/1758206825756000613
https://twitter.com/sama/status/1758206987094147252
https://twitter.com/OpenAI/status/1758192965703647443
https://twitter.com/OpenAI/status/1758192957386342435
Sora 能够生成包含多个角色、特定摄像机运动以及有关主题及其周围环境的细节的复杂序列。 “该模型不仅包括用户在查询中要求的内容,还包括事物在物理宇宙中应该如何存在»,该公司解释道。
目前,Sora 是 OpenAI 交给少数幸运儿的一个研究项目:艺术家、精心挑选的内容创作者和安全研究人员。创建视频需要几个小时的计算时间,而不是几天。
此外,Sora 在准确模拟复杂序列的物理原理以及因果实例方面也存在弱点。该公司给出了一个人咬了一块饼干的例子,但饼干中没有出现被咬的痕迹。空还可以左右反转。
对于那些担心失去生计的电影制作人来说,请放心:将 Sora 生成的 90 分钟剪辑拼接在一起,不可能创作出一部连贯的电影!对于相同的查询,语言模型视频每次都略有不同,这阻碍了剪辑之间的连续性。
另一方面,Sora 似乎是为社交网络上想要分享简短内容的内容创作者或需要动画广告的广告商而设计的。然而,关于数据的安全性和来源的一些最重要的问题仍有待解决。
Sora 将拒绝违反其使用条款的请求:暴力和色情内容、仇恨、与名人相似或复制受版权保护的作品。建立了一个检测系统来确定是否使用该模型生成了视频。最后,Sora 接受了 OpenAI 许可的数据以及公共领域内容的培训。这可能并不能阻止投诉的堆积!