中國第二大短片應用程序Kuaishou介紹了其新的人工智能(AI)模型Kling,旨在從文本提示中生成高質量的視頻(通過南中國早晨)。
此舉使Kuaishou與Openai的Sora和其他新興玩家進行了直接競爭。
克林

克林如何工作
當前處於試驗階段,克林可以將文本提示轉換為長達兩分鐘的視頻剪輯,分辨率為1080p。根據公司,克林支持各種縱橫比,可以產生現實和富有想像力的場景。
演示視頻展示了一系列場景,包括一隻白貓穿過城市街道和一個男孩在吃芝士漢堡。
Kuaishou的Kling旨在與Openai's Sora競爭,該索拉(Sora)於今年早些時候揭幕翠貝卡電影節。
儘管Sora尚未廣泛可用,但可以通過候補表訪問Kling。其他中國競爭對手包括Shengshu Technology的Vidu和Zhipu AI即將推出的視頻生成工具。
克林使用類似於Sora的擴散變壓器模型來創建具有逼真的物理和平滑運動的視頻。 Kuaishou聲稱克林可以以每秒30幀的速度以1080p的形式生成視頻,並支持各種射擊類型和寬高比。
該模型還擁有高級的3D面部和身體重建,增強了表達式和肢體運動的準確性。
令人印象深刻的表現
克林(Kling)加入了Kuaishou越來越多的AI創新列表,包括Kwaiyii大語言模型(LLM)和Kolors文本對圖像模型。該公司還提供了AI舞者功能,並正在根據Kling的功能開發圖像與視頻功能。
根據SCMP的數據,Kuaishou在2024年第一季度報告說,淨利潤為41.2億元人民幣(5.751億美元),這比上一年的虧損顯著轉變。
在在線營銷服務和電子商務驅動的驅動下,收入同比增長17%。 Kuaishou擁有近4億個活躍用戶,仍然是短視頻應用程序市場的主要參與者,僅次於Bondedance的Douyin。
尚不清楚Kuaishou是否會在中國以外釋放克林。這種先進的AI技術的全球可用性可以加速競爭和創新,可能會推動像Openai這樣的公司加快發行並增強其模型的安全性和成本效益。
在其他新聞中
一個學習通過Epoch AI警告說,AI語言模型的公開培訓數據可能會在2030年代初就會耗盡,這可能會停止AI的進度。
研究指出,近年來,AI的顯著增長受到了更大的模型和擴展數據集的推動。但是,互聯網供應高質量的人類生成的文本,即Chatgpt等AI模型的命脈,並非無限。
保持在Tech Times。