- DeepSeek是一家中國人工智能初創公司,目前是技術界唯一可以談論的事情。
- 在美國證券交易所,與人工智能相關的公司於週一成立。
- 現在,美國科技公司必須重新考慮自己,既然AI Model R1的DeepSeek似乎正在改變遊戲規則。
- 另請閱讀:中國AI模型DeepSeek是Apple App Store下載最多的應用程序,並將Western Chip Companies的種族推銷
由於中國初創公司DeepSeek的到來,技術界之所以顛倒,該公司上週發布了AI Model R1。這是一個可以與人工智能的所謂開源模型最好的Openai,Chatgpt的創建者違反了一小部分成本。
在矽谷,經理,投資者和員工的興奮令人興奮。每個人似乎都對這種廉價高效的模型需要這樣的含義有意見。
一些疑問,由於deepseek r1是根據過時的硬件,只有600萬美元的製造商,因此在美國的AI基礎設施上花費了數千美元,因為DeepSeek R1是開發的。其他人則主要看到新模型中的潛力。
我們還不知道DeepSeek R1到來的後果是什麼。然而,可以看到一些趨勢。這是DeepSeek可以以新的方式塑造人工智能未來的7種方式。
1。採用生成的AI增長爆炸性
首席執行官寫道:“傑文斯悖論再次罷工!”薩蒂亞·納德拉(Satya Nadella)從星期一早上在X上的微軟開始。“現在AI變得更加高效,更容易訪問,我們將更多地使用它,使其成為我們無法獲得足夠的基本產品。”
德·傑文斯(De Jevens)的悖論是,如果有些事情變得更好,對它的需求將會增加。根據納德拉(Nadella)的說法,這一19世紀的原則顯然也適用於人工智能的應用。 R1的到來可以降低公司與AI合作的門檻,因為成本要低得多。便宜的工具可以是實驗和實施它的方式。
董事總經理Umesh Padval說:“這就像Llama(Meta的開源AI模型),它降低了實施的閾值。這使更多公司可以開始使用AI並實際使用它。”內部人士。
也就是說,即使AI的採用速度比以往任何時候都要快,但這並不一定意味著美國科技公司投資的數十億也可以被收回。
2. DeepSeek改變了人工智能成本的看法
Menlo Ventures的投資者Debarghya Das說:“ DeepSeek似乎突破了您需要大量資本來培訓最佳模型的假設。”
根據財務諮詢公司Bernstein的分析師的說法,與OpenAI的高質量模型相比,使用DeepSeek的開源模型的成本少於20至40倍。
建立DeepSeek的AI模型的成本仍在討論中。製造商聲稱,培訓V3型號的費用為560萬美元。這比在矽谷撤出的數十億要低得多,以訓練類似的型號。
但是製造商確實承認,有560萬美元不是全部金額。關於DeepSeek-V3的研究報告指出,這一數量僅是關於培訓模型的。尚未包括早期的調查和其他實驗的其他費用。
此外,科技界還批評了這一說法高效的AI DeepSeek模型轉彎便宜。
金融服務提供商Morningstar的Kennet Lamont在周一的一份報告中寫道:“這一突破降低了對計算能力的需求,使成本降低。這給行業中的知名人士帶來了壓力,例如Microsoft和Google ,以證明其高價。” 。
他提醒投資者,在獲獎者所說的新技術的第一個跡像上假設並不明智。他寫道:“大趨勢幾乎永遠不會像您期望的那樣奔跑。今天的主要球員不必成為明天的贏家。”
AI-Startup困惑的首席業務官Dmitry Shevelenko還認為,目前的主要參與者必須再次查看這些數字。他告訴Business Insider:“當然,這質疑他們對投資者感到恐懼的利潤率。” “但是對於開發這些類型的技術的速度,這是一件好事。
同時,《困惑》已將DeepSeek AI模型添加到用於其平台的模型中。
3。考慮轉換為DeepSeek
週一,提供了用於業務使用的AI模型的多個平台,例如Groq和Liquid.ai,宣布他們將DeepSeek的供應添加到了其投資組合中。
在亞馬遜(Amazon)向AI-Startup Anthropic投資數十億美元的亞馬遜,該消息也內部得到了回應。在科技巨頭的內部鬆弛頻道上,有人放置了一個模因,建議開發人員可以從Anthropics Claude轉換為DeepSeek的AI模型。
放置的圖像顯示了克勞德(Claude)的十字架,上面寫著:“與克勞德(Claude)的友誼結束了。現在,DeepSeek是我最好的朋友。”
也在Amazon AWS客戶(公司的雲分支)對DeepSeek模型的需求正在增加。
它使公司構建自己的應用程序的公司付費在現有的AI模型上,相對較少可切換。結果,許多人對其他模型的奇蹟,例如元,人類或Openai的其他模型將在市場上打印出來。
但是,DeepSeek有一個主要的劣勢:它是中國樹籬高空傳單的一部分。公司的起源會引起有關安全和隱私的疑問,如果使用具有中國起源的產品。
“儘管諸如DeepSeek之類的開源模型提供了有趣的機會,但公司可能不願轉移到來自中國的AI模型。這主要是由於對培訓日期,隱私和安全的透明度的擔憂。” PADVAL VAN THOMVEST冒險。
4。AI基礎設施的提供者可能受到影響
運行AI模型的基礎架構的提供商,例如Oracle,Digital Ocean和Microsoft,最終可能會處於困難的位置,以更高效的模型開始上升。
美國投資銀行Stifel的分析師在一份新報告中寫道:“ DeepSeek的培訓方法的效率(如果為frue)提出了一個問題,即世界範圍內的大型評分者和政府是否只能在一份新報告中寫道。”
如果完成相同的工作所花費的計算能力較少,那麼那些出售這種計算能力的人會遭受此類開發的影響,將要求投資銀行巴克萊分析師。 “隨著不確定性的增加,很可能是甲骨文,數字海洋和微軟的價格壓力增加。”
5。以不同的方式擴展
包括Nvidia的首席執行官Jensen Huang在內的人工智能界的知名人士已經聲稱,AI世界中正在發生重大轉變。這個想法是,AI模型用來得出答案的計算能力將使用更多的計算能力,而不是在與數據的更多培訓上使用此計算能力。
簡而言之:在使用模型之前進行培訓。在這一點上,AI模型正在盡可能多的數據進行培訓。如果使用AI模型,則將應用所謂的“推理”。然後,它使用訓練有素的數據作為參考工作,以便通過某些推理步驟生成答案。
以不同的方式說:培訓是您在學校學到的,推斷是將這些知識應用於您的工作。
這種轉變已經進行了一段時間,但是現在正在加速,因為這樣做的壓力來自雙方。首先,用戶的增加意味著必須在推理上使用更多的計算能力。由於DeepSeek R1的工作方式,第二點現在出現了。推理時,該模型可以改善自我。到目前為止尚未完成。改進是通過更多的培訓和微調AI模型進行的。
NVIDIA發言人說:“ DeepSeek是AI開發的好一步,也是如何應用'測試時間擴展'的一個很好的例子。DeepSeek的工作表明瞭如何使新模型使用這種技術。”試圖將Deepsek R1崛起的興起朝著業務內部人士崛起。
“推理需要大量的Nivdia處理器和一個良好的性能網絡。我們現在有三個有關可伸縮性的定律:培訓前,培訓後 - 仍然存在 - 以及新的測試 - 時間擴展。”
6。開源改變了AI型號的方式
Anthropic的聯合創始人傑克·克拉克(Jack Clark)說,DeepSeek提出的創新最少的部分是採用現有的AI模型並將其轉變為更有力的“理由”模型。在他的時事通訊中。
克拉克還指出,一些AI公司(例如OpenAI)對其AI模型的推理步驟不透明。 DeepSeek模型確實在“思想鏈”中顯示了所有這些步驟。這意味著每個人都可以查看和使用推理模式。克拉克寫道,這改變了AI模型的控制方式。
“一些提供商,例如Openai,用於選擇思想鏈從他們的模型到隱藏,“克拉克都可以將現有模型變成可以推理的AI模型。
7。編程人員仍然很重要
通過使用新的編程方法改善了DeepSeek。聯合創始人Samir Kumar Van Durfkapitalist Touring Capital認為這表明人們仍然負責AI中最令人印象深刻的創新。
他告訴Business Insider,DeepSeek清楚地表明,不應低估“鐵桿人類程序員”的才能和能力。