Openai推出了其最新的創新Sora模型,該模型能夠根據文本輸入製作長時間的視頻。但是,在進行對其潛在濫用的徹底評估之前,公眾將不容易訪問該模型。

提示:一個時尚的女人走在東京街上,裡面充滿了溫暖的霓虹燈和動畫的城市標牌。她穿著黑色皮夾克,一件長長的紅色連衣裙和黑色靴子,並帶有黑色錢包。她戴太陽鏡和紅色唇膏。她自信和隨便走路。街道潮濕且反射性,從而產生了五顏六色的燈光的鏡子效果。許多行人走來走去。
從文本提示中生成長時間的視頻
以日語單詞的“天空”命名Engadget報導說,Sora代表了AI生成的視頻技術的重大進步。
Openai並沒有立即將Sora發布給公眾,而是選擇了與精選的學者和研究人員一起訪問。他們的任務是評估模型的功能並評估與使用相關的任何風險。
Sora表現出極大的熟練程度,以產生具有多個字符,動態動作和詳細環境的複雜場景。該模型不僅可以準確地解釋文本提示,而且還可以理解所描繪方案中的空間關係。
索拉的局限性
根據Openai,Sora根據“對語言的深刻理解”進行操作,允許它準確地解釋文本提示。但是,像大多數AI圖像和視頻生成器一樣,Sora並非完美無瑕。
在一個例子中,達爾馬提亞人透過窗戶的要求的要素,人們“沿著運河街道行走和騎自行車”被產生的視頻完全省略了。
此外,Openai警告說,該模型可能會在理解因果關係方面掙扎,這在視頻中很明顯,其中一個人被描繪成一個沒有可見咬合的餅乾。
通過測試與視頻模型一起加入公司
Sora加入了由Meta,Google和Runway等公司開發的文本到視頻模型的不斷增長的景觀。雖然已經引入或暗示了其他工具,但沒有一個與Sora製作長度60秒的視頻的能力相匹配的。
此外,與同行不同,Sora一口氣生成完整的視頻,從而確保整個視頻中的主題一致,即使它們短暫退出了框架。
文本到視頻工具的出現引起了人們對產生高度逼真的虛假內容的潛力的擔憂。
華盛頓大學的教授Oren Etzioni專門研究人工智能,真正的媒體創始人表示深切關注,尤其是對潛在的對密切競爭選舉的影響。
而且,《紐約時報》據報導,由於技術的能力,據報導,更廣泛的生成AI採用引發了藝術家和創意專業人士的強烈反對。
為了應對這些問題,Openai強調了其與各個領域的專家的合作,包括錯誤信息,可恨的內容和偏見,以在公開發布之前徹底評估該工具的含義。
此外,該公司正在開發能夠識別Sora生成的視頻的檢測工具,並在視頻中嵌入元數據以促進檢測。
儘管OpenAI並未透露有關Sora培訓過程的具體細節,但它指出了版權持有人的公開視頻和許可內容的利用。
