Openai的Sora可能面臨其最大的競爭對手。 Luma的人工智慧視頻生成器,夢想機器,在對該軟件的免費公開Beta版本的首次亮相需求之後,導致了多個小時的等待時間。
正如該公司確認的那樣,由著名的矽谷風險投資公司安德森·霍洛維茨(Andreessen Horowitz)支持的初創公司表示,流量的巨大量導致了更長的視頻處理時間,同時表明他們將繼續增加軟件容量。

截至2024年1月,報導稱,這家鮮為人知的技術創業公司已獲得超過7000萬美元的收入,尤其是其係列B中的4,300萬美元。這家初創公司於2023年11月首次亮相其文本至3D資產的模型Genie 1.0。這是這家初創公司出色的AI視頻生成器的頂部。
在公共Beta開放之前,允許著名的AI視頻創建者和電影製片人通過文本提示和靜止圖像創建視頻的能力。事實證明,早期的帖子是積極的,而其他人僅僅掌握了它的人也發現它非常令人印象深刻。這引起了與Openai的Sora的比較,而有人說它已經很出色。
來自其他來源的測試表明,文本對視頻功能僅偶爾在提示中描繪了所要求的內容。這部電影僅在短短幾分鐘內製作,具有高分辨率,高度詳細的材料以及令人難以置信的光滑,不吉利的動作。
中國的簡短視頻應用程序加入AI視頻生成競賽
使用一個名為克林,中國的第二大視頻應用程序Kuaishou最近參加了創建最佳AI視頻生成器的比賽。據說該應用程序可以使用文本提示產生高質量的視頻。
克林目前處於實驗模式。它可以將文本輸入轉換為1080p視頻剪輯,長達兩分鐘。製造商聲稱,克林可以產生現實而幻想的場景,並支持各種縱橫比。示範電影展示了各種場景,例如男孩吃漢堡包和一隻白貓在城市街道上行駛。
Google的Lumiere
今年,Lumiere是最早的AI視頻生成程序之一Google。該Google研究項目中介紹了一種新穎的時空U-NET體系結構,該項目可以在單個模型通行證中產生整個視頻的時間持續時間。
與其他生成遠程密鑰幀之後的視頻模型不同,Lumiere使用了一種獨特的技術,使全球時間一致性更具實現。
該體系結構將時間和空間向上採樣與已經訓練的文本擴散模型結合在一起。 Lumiere現在可以在各種時空量表上處理數據,並在本地輸出一個全面速率,低分辨率視頻。
開創性的時空U-NET體系結構可以生成全幀速率視頻剪輯,用於使用,從圖像到視頻和視頻介紹到創建樣式內容。
