
您很快就不必拥有相机来使用人工智能制作逼真的视频。 Openai揭开了通过引入Sora,它在视频产生技术方面的最新进步。 Sora被定位为增强视觉讲故事的工具,可以使用户能够将文本说明转化为复杂性的视频场景,从现实到想象力。
Sora的主要功能是根据文本提示生成视频,使用户可以创建最长一分钟的内容。以现实主义和想象力的重点,该模型可以从对物理世界的理解中构建具有多个字符,各种动作和详细环境的场景。
一篇公司博客文章说:“该模型对语言有深刻的了解,使其能够准确地解释提示并产生引人注目的角色,以表达充满活力的情绪。” “ Sora还可以在单个生成的视频中创建多个镜头,以准确地持久角色和视觉样式。”
除了基于文本的输入外,Sora还通过从静止图像中生成内容并扩展现有镜头来提供视频创建的灵活性。 Openai展示了Sora的功能,包括淘金热期间的加利福尼亚鸟瞰图和模拟的东京火车之旅等场景。
尽管具有令人印象深刻的功能,但索拉并非没有局限性。用户可能会偶尔在模拟物理或其他次要瑕疵中遇到差异。但是,Openai承认这些挑战是正在进行的发展过程的一部分。
当前,访问Sora仅限于一组被称为“红色团队”的个人,他们的任务是评估模型的潜在风险和危害。此外,OpenAI扩展了对某些视觉艺术家,设计师和电影制片人的访问,以收集有关模型性能的反馈。值得注意的是,现有版本的Sora可能无法准确模拟复杂的物理场景,并且可能难以正确解释某些因果关系。
在最近的一项发展中,OpenAI宣布在其文本对图像工具Dall-E 3上实施水印。但是,该组织承认这些水印很容易被删除。这一举动是因为Openai努力应对其AI产品的含义,尤其是AI生成的感性视频被误认为是真实内容的风险。这强调了解决AI生成的媒体被用来欺骗或操纵受众的潜在后果的持续挑战。