Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

字节跳动发布全新生成式AI模型OmniHuman

  • 2025-02-05
  • Sherise

中国科技公司提出了一个生成式人工智能框架,可以基于单个图像和运动信号(称为 OmniHuman-1)创建高度逼真的人类视频。

字节跳动的研究人员证明了该技术通过生成几个逼真的人类视频来实现,其中包括阿尔伯特·爱因斯坦和英伟达首席执行官黄仁勋。这些视频展示了人类以具有挑战性的身体姿势(包括用手)以及不同的长宽比(例如肖像、半身和全身)说话和唱歌。该系统还可以制作卡通动画。

TikTok 背后的公司表示,该框架击败了现有技术,而现有技术仍在努力扩展到动画面部或上半身之外,限制了它们在实际应用中的潜力。一项研究表明,OmniHuman 优于现有方法,因为它可以根据微弱信号输入(尤其是音频)生成极其逼真的人类视频纸由公司发布。

研究人员写道:“在 OmniHuman 中,我们引入了多模态运动调节混合训练策略,使模型能够从混合调节的数据扩展中受益。” “这克服了以前的端到端方法由于缺乏高质量数据而面临的问题。”

研究人员依靠超过 18,000 小时的人类相关数据来训练该框架,使其能够从文本、音频和身体动作中学习。这使得人类视频看起来更加自然。

该论文表示:“我们的主要见解是,在训练过程中结合多种条件信号,例如文本、音频和姿势,可以显着减少数据浪费。”

该系统最初独立处理每种输入类型,将文本描述、参考图像、音频信号和运动数据的运动细节压缩为紧凑的格式。然后,它逐步将这些数据增强为真实的视频输出,通过将其结果与真实视频进行比较来完善运动生成。

字节跳动一直在投资人工智能视频生成,与 Meta、微软和谷歌 DeepMind 等公司竞争。 1月份,公司释放其AI模型豆宝的升级,声称其性能优于OpenAI的o1基准测试AIME。

文章主题

|||||

相關貼文

Sumsub认可数字包容性工作,看到持续增长

Sumsub认可数字包容性工作,看到持续增长

IDEMIA公共安全最新的NIST指纹评估

IDEMIA公共安全最新的NIST指纹评估

生物识别、网络安全内部人士对 2025 年深度伪造威胁的预测

生物识别、网络安全内部人士对 2025 年深度伪造威胁的预测

德克萨斯州引入彩票自动售货机年龄验证

德克萨斯州引入彩票自动售货机年龄验证

社交媒体使用需要在尼泊尔和越南进行ID验证

社交媒体使用需要在尼泊尔和越南进行ID验证

电子邮件服务Kivra收购了数字ID公司Truid

电子邮件服务Kivra收购了数字ID公司Truid

赞比亚获得了世界银行的资金支持,以推动DPI实施

赞比亚获得了世界银行的资金支持,以推动DPI实施

欺诈行为:综合身份,注射攻击改变安全格局

欺诈行为:综合身份,注射攻击改变安全格局

OFDIA更新登记处的身份验证公司DIATF认证

OFDIA更新登记处的身份验证公司DIATF认证

熱門閱讀

  • 通过先进的扫描技术,没收的铁器时代伊朗剑被证明是仿制品 2024-09-28
  • 1.61 亿年前的化石是已知最古老的蝌蚪 2024-10-31
  • 未经证实的爱因斯坦“重力记忆”理论毕竟可能是真实的,新研究暗示 2025-03-06
  • 哈勃在室女座星团中发现冲压压力剥离螺旋星系:IC 3225 2024-10-21
  • 澳大利亚出土的埃迪卡拉线虫状蠕虫化石 2024-11-20
  • 罗马尼亚的trov剂:球茎的“活岩”启发了恐龙卵和外星人的民俗故事 2025-02-07
  • 长期解决的神秘:科学家发现细胞如何创建“垃圾袋”以消除废物 2025-03-18
  • 重复快速射电爆发追踪到静止椭圆星系的外围 2025-01-21
  • 生物识别、网络安全内部人士对 2025 年深度伪造威胁的预测 2025-01-03
  • 研究表明,哺乳动物在白垩纪时期变得更加陆地。 2025-04-02

上升趨勢

  • 維基百科剛剛給AI部門贈送了巨大的禮物 2025-04-18
  • DeepSeek將在美國取景器中:這是特朗普政府可以宣布的 2025-04-18
  • 根據ANSSI的說法,針對法國的網絡攻擊目前正在針對公共交通 2025-04-18
  • 它將像熱門蛋糕一樣銷售:Redmi Note 14 Pro以令人難以置信的價格( 2025-04-18
  • 01net早晨:最好的“魔術橡皮”,奧迪Q6 e-tron的超級力量,與chatgpt保持友善很昂貴 2025-04-18
  • 這是Moing V,第一個折疊式閱讀器 2025-04-18
  • Intel Core i9,24 GB的RAM,SSD 1 TO TO,此迷你PC Bmax以微不足道的價格是一個純粹的掘金 2025-04-18
  • “但是是什麼?” »:特朗普將馬斯克排除在與中國戰爭的秘密簡報之外 2025-04-18
  • iPhone增加了生產,三星取出香檳 2025-04-18
  • 橙色後機:Livebox 6已經回來了 2025-04-18

最近發布

  • Investopedia 顾问委员会简介 2024-11-30
  • 2025 Ram 2500/3500 重型准备打破盖子 2025-01-06
  • AI现在可以更快地学习100倍而不会浪费能量 2025-03-10
  • Investopedia 金融审查委员会 2024-11-12
  • 如何安装您自己的 UniFi 云控制器 2023-07-04
  • 欧洲古代人类开始控制火的时间比我们想象的要早得多 2023-05-19
  • 杰西卡·阿尔芭分享了一段拍摄家庭度假的搞笑幕后视频 2021-11-11
  • 如何在 Facebook 上分享 Instagram 帖子:分步指南(2024) 2023-12-08
  • 马克·阿奎(MarcAgué)如何定义超现代性? 2025-03-08
  • 整形外科作为艺术?关于 ORLAN 的 6 个事实 2024-11-12

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜