Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

DeepSeek 正在向世界各地發送衝擊波。這就是為什麼。

  • 2025-01-29
  • Scien

中國人(AI)公司DeepSeek已發送科技界的衝擊波,發布了極其高效的人工智能模型,可以與 OpenAI 和 Anthropic 等美國公司的尖端產品競爭。

DeepSeek 成立於 2023 年,取得了成果其現金和計算能力只是競爭對手的一小部分。

DeepSeek上週發布的“推理”R1模型引起了研究人員的興奮、投資者的震驚以及人工智能重量級人物的回應。該公司於1月28日跟進一個模型可以處理圖像和文本。

那麼 DeepSeek 做了什麼,又是如何做到的呢?

(賈斯汀·沙利文/蓋蒂圖片社)

12 月,DeepSeek 發布了V3型號。這是一個非常強大的“標準”大型語言模型,其性能與 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 3.5 類似。

雖然這些模型很容易出錯並且有時自己編造事實,他們可以執行諸如回答問題、撰寫論文和生成計算機代碼等任務。在一些測試在解決問題和數學推理方面,他們的得分高於普通人。

V3 的訓練地點為報告成本約558萬美元。例如,這比 GPT-4 便宜得多,其成本超過1億美元發展。

DeepSeek 還聲稱使用了大約 2,000 個專用計算機芯片來訓練 V3,特別是NVIDIA 製造的 H800 GPU。這又比其他可能使用過的公司少得多最多 16,000更強大的 H100 芯片。

1月20日,DeepSeek發布了另一個模型,稱為R1。這就是所謂的“推理”模型,試圖一步步解決複雜的問題。這些模型似乎更適合許多需要上下文且具有多個相互關聯部分的任務,例如閱讀理解和戰略規劃。

R1 模型是 V3 的調整版本,採用強化學習技術進行修改。 R1 的工作水平似乎與OpenAI 的 o1,去年發布。

DeepSeek 還使用相同的技術來製作可以在家用計算機上運行的小型開源模型的“推理”版本。

此次發布引發了人們對 DeepSeek 的巨大興趣,推高了其受歡迎程度V3 支持的聊天機器人應用程序並觸發一個大規模的價格暴跌隨著投資者重新評估人工智能行業,科技股受到關注。在撰寫本文時,芯片製造商 NVIDIA損失約6000億美元在價值上。

DeepSeek 是如何做到的

DeepSeek 的突破在於實現更高的效率:用更少的資源獲得良好的結果。特別是,DeepSeek 的開發人員開創了兩種可能被人工智能研究人員更廣泛採用的技術。

第一個與稱為“稀疏性”的數學概念有關。 AI 模型有很多參數決定它們對輸入的響應(V3 有大約 6710 億個),但這些參數中只有一小部分用於任何給定的輸入。

然而,預測需要哪些參數並不容易。 DeepSeek 使用一種新技術來做到這一點,然後僅訓練這些參數。因此,它的模型需要的訓練比傳統方法少得多。

另一個技巧與 V3 如何在計算機內存中存儲信息有關。 DeepSeek 找到了一種巧妙的方法來壓縮相關數據,因此更容易存儲和快速訪問。

這意味著什麼

DeepSeek的模型和技術已經免費發布我的許可證,這意味著任何人都可以下載和修改它們。

雖然這對一些人工智能公司來說可能是個壞消息——它們的利潤可能會因免費提供的強大模型的存在而受到侵蝕——但對更廣泛的人工智能研究社區來說卻是個好消息。

目前,許多人工智能研究需要訪問大量的計算資源。像我這樣在大學(或除大型科技公司之外的任何地方)工作的研究人員進行測試和實驗的能力有限。

更有效的模型和技術改變了這種情況。現在,實驗和開發對我們來說可能變得更加容易。

對於消費者來說,使用人工智能也可能變得更便宜。更多的人工智能模型可能會在用戶自己的設備上運行,例如筆記本電腦或手機,而不是在“雲端”運行以收取訂閱費。

對於已經擁有大量資源的研究人員來說,提高效率可能效果較小。目前尚不清楚 DeepSeek 的方法是否有助於構建整體性能更好的模型,或者只是更高效的模型。

Tongliang Liu,副教授悉尼人工智能中心主任悉尼大學

本文轉載自對話根據知識共享許可。閱讀原創文章。

相關貼文

兒童近視率正在上升。以下是如何保護孩子的視力。

兒童近視率正在上升。以下是如何保護孩子的視力。

打破紀錄:帕克探測器在歷史性的聖誕節飛越中親吻太陽

打破紀錄:帕克探測器在歷史性的聖誕節飛越中親吻太陽

以梅林為特色的罕見亞瑟王續集發現了中世紀記錄

以梅林為特色的罕見亞瑟王續集發現了中世紀記錄

地衣在惡劣的火星般的條件下壯成長,突破性的研究發現

地衣在惡劣的火星般的條件下壯成長,突破性的研究發現

聊天機器人通過了類似人類的智能的重要測試。現在是什麼?

聊天機器人通過了類似人類的智能的重要測試。現在是什麼?

研究表明,地球湖泊中的氧氣水平正在下降。

研究表明,地球湖泊中的氧氣水平正在下降。

死亡細胞以令人驚訝的同類相食的方式從體內清除

死亡細胞以令人驚訝的同類相食的方式從體內清除

西紅柿不會殺死人,我們只是弄清楚為什麼

西紅柿不會殺死人,我們只是弄清楚為什麼

腦部掃描證實嬰兒形成記憶,挑戰長期信念

腦部掃描證實嬰兒形成記憶,挑戰長期信念

熱門閱讀

  • 什麼是總量控制與交易?政策、範例和有效性 2024-12-05
  • 石棉仍然出現在一些化妝品中。這就是為什麼。 2024-11-21
  • 擁擠的港口和空蕩蕩的貨架:美國碼頭工人罷工將如何影響您? 2024-10-03
  • BONOBOS知道您不知道的東西,並且願意以一個價格說明 2025-02-06
  • CeraVe 是零殘忍、純素且可持續的嗎? 2025-01-03
  • 您會購買額外的 PTO 嗎? 66% 的員工表示願意,原因如下 2024-12-12
  • 研究發現,一種常見的安眠藥可以減少阿茲海默症蛋白質的積累 2024-12-26
  • 「高度敏感族群」佔工人的 26%。這對您的辦公室意味著什麼 2025-01-01
  • 12 輛巴士改裝成有輪子的精美小房子 2024-12-26
  • 專家稱,沙龍洗髮可能對健康構成嚴重威脅 2025-01-17

上升趨勢

  • 根據ANSSI的說法,針對法國的網絡攻擊目前正在針對公共交通 2025-04-18
  • 發行人:有必要盡快撤回您的錢嗎?我們將真實脫離了錯誤 2025-04-18
  • 它以30i/s的速度拍攝8K,135分鐘的自主權:Insta360 X4售罄,並將比賽投入了比賽。 2025-04-18
  • Android 16:Google糾正了鏡頭,最後放回了這個基本的捷徑 2025-04-18
  • 這不是iPad,但性能很瘋狂,價格便宜2倍 2025-04-18
  • 唐納德·特朗普(Donald Trump)在半導體上收緊絞索...對美國經濟的冒險賭注 2025-04-18
  • 橙色後機:Livebox 6已經回來了 2025-04-18
  • 個性化您的三星星係以前從未有過:最終在Google Play上的終極工具 2025-04-18
  • 暗物質的新形式可能解釋了銀河系的核心奧秘 2025-04-17
  • 01net早晨:最好的“魔術橡皮”,奧迪Q6 e-tron的超級力量,與chatgpt保持友善很昂貴 2025-04-18

最近發布

  • 跨過這座小橋,您將進入一個新的國家和新的時區 2024-11-19
  • 2024 年即將結束,公牛隊希望舉辦一場“聖誕老人集會” 2024-12-19
  • 新的研究將多動症鏈接到明顯較短的預期壽命 2025-01-26
  • Jeopardy! 的原始系列首映日期是哪一天? 30年前的今天! 2024-03-30
  • iPhone 訊息無法下載圖片?立即嘗試的 10 個修復方法 2024-04-17
  • 圭亞那政黨敦促 GECOM 現在就選舉生物辨識技術做出決定 2025-01-09
  • 《Shark Tank》中最錯失的機會之一現在是一款流行的約會應用程式 2024-12-16
  • 與Maya的對話:Anna-Katrina Shedletsky 2025-04-04
  • 映射:美國各州 100 美元的購買力 2024-09-06
  • 排名:按國家劃分的人們去看醫生的頻率 2024-11-14

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜