Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

字節跳動發布全新生成式AI模型OmniHuman

  • 2025-02-05
  • Sherise

中國科技公司提出了一個生成式人工智能框架,可以基於單個圖像和運動信號(稱為 OmniHuman-1)創建高度逼真的人類視頻。

字節跳動的研究人員證明了該技術通過生成幾個逼真的人類視頻來實現,其中包括阿爾伯特·愛因斯坦和英偉達首席執行官黃仁勳。這些視頻展示了人類以具有挑戰性的身體姿勢(包括用手)以及不同的長寬比(例如肖像、半身和全身)說話和唱歌。該系統還可以製作卡通動畫。

TikTok 背後的公司表示,該框架擊敗了現有技術,而現有技術仍在努力擴展到動畫面部或上半身之外,限制了它們在實際應用中的潛力。一項研究表明,OmniHuman 優於現有方法,因為它可以根據微弱信號輸入(尤其是音頻)生成極其逼真的人類視頻紙由公司發布。

研究人員寫道:“在 OmniHuman 中,我們引入了多模態運動調節混合訓練策略,使模型能夠從混合調節的數據擴展中受益。” “這克服了以前的端到端方法由於缺乏高質量數據而面臨的問題。”

研究人員依靠超過 18,000 小時的人類相關數據來訓練該框架,使其能夠從文本、音頻和身體動作中學習。這使得人類視頻看起來更加自然。

該論文表示:“我們的主要見解是,在訓練過程中結合多種條件信號,例如文本、音頻和姿勢,可以顯著減少數據浪費。”

該系統最初獨立處理每種輸入類型,將文本描述、參考圖像、音頻信號和運動數據的運動細節壓縮為緊湊的格式。然後,它逐步將這些數據增強為真實的視頻輸出,通過將其結果與真實視頻進行比較來完善運動生成。

字節跳動一直在投資人工智能視頻生成,與 Meta、微軟和谷歌 DeepMind 等公司競爭。 1月份,公司釋放其AI模型豆寶的升級,聲稱其性能優於OpenAI的o1基準測試AIME。

文章主題

|||||

相關貼文

Identy.io備用以提供生物識別支持,作為美國旅行者湧入的US牙套

Identy.io備用以提供生物識別支持,作為美國旅行者湧入的US牙套

塞浦路斯打開了數字ID發行的申請流程

塞浦路斯打開了數字ID發行的申請流程

日本 My Number ID 正式取代健康保險卡

日本 My Number ID 正式取代健康保險卡

企業IAM保護通過戰略投資,編排工具擴展

企業IAM保護通過戰略投資,編排工具擴展

網路治理論壇解決可信任數位身分系統的障礙

網路治理論壇解決可信任數位身分系統的障礙

美國生物辨識旅行得到公眾支持,需要統一標準

美國生物辨識旅行得到公眾支持,需要統一標準

新計劃,但英國的“數字政府中心”的名字相同

新計劃,但英國的“數字政府中心”的名字相同

Yoti 回應 Ofcom 關於色情網站年齡檢查的指導

Yoti 回應 Ofcom 關於色情網站年齡檢查的指導

泰國在高調綁架中國演員之後推出AI監視系統

泰國在高調綁架中國演員之後推出AI監視系統

熱門閱讀

  • 中國的人工智能突破:DeepSeek發布了升級的LLM模型,再次挑戰了西方的主導地位 2025-03-25
  • 摩爾多瓦計劃分佈生物識別捕獲設備到其外交任務 2025-03-18
  • 稀有彗星在墜落太陽時可能會像金星一樣明亮:對 ATLAS (C/2024) G3 彗星有何期待 2025-01-08
  • 兩門俄羅斯2S7 Pion火砲在一處被毀 2025-01-10
  • 太空人為太空行走做準備,SpaceX 龍飛船發射再次推遲 2024-12-06
  • 令人驚嘆的 JWST 新圖像展示了一顆老年恆星的複雜外殼 2022-08-30
  • 科學家揭開「戴珍珠耳環的女孩」的秘密 2024-09-22
  • 研究顯示統計「噪音」會影響感知的演化速度 2024-09-23
  • 尼古丁含量較低的香菸可能有助於一些吸菸者戒菸 2025-01-17
  • 廢水處理廠關閉後浮游植物群落發生變化 2024-10-01

上升趨勢

  • 這不是iPad,但性能很瘋狂,價格便宜2倍 2025-04-18
  • 全球變暖慢慢污染了世界飲食的支柱之一 2025-04-18
  • DeepSeek將在美國取景器中:這是特朗普政府可以宣布的 2025-04-18
  • 01net早晨:最好的“魔術橡皮”,奧迪Q6 e-tron的超級力量,與chatgpt保持友善很昂貴 2025-04-18
  • 根據ANSSI的說法,針對法國的網絡攻擊目前正在針對公共交通 2025-04-18
  • 地球水的起源可能不像我們想像的那麼複雜 2025-04-17
  • 有了這個項目,MG希望以不到20,000歐元的價格出售電動汽車 2025-04-18
  • 外星人生活的最有力的證據尚未發現124光年 2025-04-17
  • 維基百科剛剛給AI部門贈送了巨大的禮物 2025-04-18
  • 橙色後機:Livebox 6已經回來了 2025-04-18

最近發布

  • 如何設定新的 iPod shuffle 2024-01-25
  • 在 Chromebook 上安裝 Adobe Flash 2023-11-03
  • Jared Krebsbach:關於作者 2025-02-05
  • 中東生物辨識門禁需求成長有利於 HID、Invixium 2025-01-21
  • 物理學家提出了一種用於暗物質探測的量子光機械解決方案 2024-12-07
  • Persona 的自拍生物辨識技術為 Dasher 提供更即時的身份驗證 2024-12-17
  • 考古學家在非洲找到世界上最古老的骨工具 2025-02-28
  • OM vs OL(法甲):足球之後,球員之間的一般戰鬥 2024-04-25
  • 上一個冰河時代後,海平面上升了多高? 2025-03-20
  • 詹姆斯韋伯望遠鏡在 2023 年拍攝了一些令人驚嘆的影像 2023-12-14

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜