Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

DeepSeek 正在向世界各地發送衝擊波。這就是為什麼。

  • 2025-01-29
  • Scien

中國人(AI)公司DeepSeek已發送科技界的衝擊波,發布了極其高效的人工智能模型,可以與 OpenAI 和 Anthropic 等美國公司的尖端產品競爭。

DeepSeek 成立於 2023 年,取得了成果其現金和計算能力只是競爭對手的一小部分。

DeepSeek上週發布的“推理”R1模型引起了研究人員的興奮、投資者的震驚以及人工智能重量級人物的回應。該公司於1月28日跟進一個模型可以處理圖像和文本。

那麼 DeepSeek 做了什麼,又是如何做到的呢?

(賈斯汀·沙利文/蓋蒂圖片社)

12 月,DeepSeek 發布了V3型號。這是一個非常強大的“標準”大型語言模型,其性能與 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 3.5 類似。

雖然這些模型很容易出錯並且有時自己編造事實,他們可以執行諸如回答問題、撰寫論文和生成計算機代碼等任務。在一些測試在解決問題和數學推理方面,他們的得分高於普通人。

V3 的訓練地點為報告成本約558萬美元。例如,這比 GPT-4 便宜得多,其成本超過1億美元發展。

DeepSeek 還聲稱使用了大約 2,000 個專用計算機芯片來訓練 V3,特別是NVIDIA 製造的 H800 GPU。這又比其他可能使用過的公司少得多最多 16,000更強大的 H100 芯片。

1月20日,DeepSeek發布了另一個模型,稱為R1。這就是所謂的“推理”模型,試圖一步步解決複雜的問題。這些模型似乎更適合許多需要上下文且具有多個相互關聯部分的任務,例如閱讀理解和戰略規劃。

R1 模型是 V3 的調整版本,採用強化學習技術進行修改。 R1 的工作水平似乎與OpenAI 的 o1,去年發布。

DeepSeek 還使用相同的技術來製作可以在家用計算機上運行的小型開源模型的“推理”版本。

此次發布引發了人們對 DeepSeek 的巨大興趣,推高了其受歡迎程度V3 支持的聊天機器人應用程序並觸發一個大規模的價格暴跌隨著投資者重新評估人工智能行業,科技股受到關注。在撰寫本文時,芯片製造商 NVIDIA損失約6000億美元在價值上。

DeepSeek 是如何做到的

DeepSeek 的突破在於實現更高的效率:用更少的資源獲得良好的結果。特別是,DeepSeek 的開發人員開創了兩種可能被人工智能研究人員更廣泛採用的技術。

第一個與稱為“稀疏性”的數學概念有關。 AI 模型有很多參數決定它們對輸入的響應(V3 有大約 6710 億個),但這些參數中只有一小部分用於任何給定的輸入。

然而,預測需要哪些參數並不容易。 DeepSeek 使用一種新技術來做到這一點,然後僅訓練這些參數。因此,它的模型需要的訓練比傳統方法少得多。

另一個技巧與 V3 如何在計算機內存中存儲信息有關。 DeepSeek 找到了一種巧妙的方法來壓縮相關數據,因此更容易存儲和快速訪問。

這意味著什麼

DeepSeek的模型和技術已經免費發布我的許可證,這意味著任何人都可以下載和修改它們。

雖然這對一些人工智能公司來說可能是個壞消息——它們的利潤可能會因免費提供的強大模型的存在而受到侵蝕——但對更廣泛的人工智能研究社區來說卻是個好消息。

目前,許多人工智能研究需要訪問大量的計算資源。像我這樣在大學(或除大型科技公司之外的任何地方)工作的研究人員進行測試和實驗的能力有限。

更有效的模型和技術改變了這種情況。現在,實驗和開發對我們來說可能變得更加容易。

對於消費者來說,使用人工智能也可能變得更便宜。更多的人工智能模型可能會在用戶自己的設備上運行,例如筆記本電腦或手機,而不是在“雲端”運行以收取訂閱費。

對於已經擁有大量資源的研究人員來說,提高效率可能效果較小。目前尚不清楚 DeepSeek 的方法是否有助於構建整體性能更好的模型,或者只是更高效的模型。

Tongliang Liu,副教授悉尼人工智能中心主任悉尼大學

本文轉載自對話根據知識共享許可。閱讀原創文章。

相關貼文

運動增強了所有年齡段的大腦功能,大量研究證實

運動增強了所有年齡段的大腦功能,大量研究證實

這顆特別蓬鬆的「爆米花」行星是個越來越奇怪的宇宙怪事

這顆特別蓬鬆的「爆米花」行星是個越來越奇怪的宇宙怪事

臨床試驗發現,抗澱粉樣藥可能會延遲阿爾茨海默氏症症狀。

臨床試驗發現,抗澱粉樣藥可能會延遲阿爾茨海默氏症症狀。

專家警告說,減肥藥物會導致骨骼和肌肉損失

專家警告說,減肥藥物會導致骨骼和肌肉損失

哪一種傳染病可能是 2025 年最大的問題?專家解釋。

哪一種傳染病可能是 2025 年最大的問題?專家解釋。

研究發現,光是一根菸就會縮短你 20 分鐘的壽命

研究發現,光是一根菸就會縮短你 20 分鐘的壽命

潛水員發現保存完好的已滅絕加勒比猴骨骼

潛水員發現保存完好的已滅絕加勒比猴骨骼

黃石公園巨大火山口下方的火山活動可能正在改變

黃石公園巨大火山口下方的火山活動可能正在改變

科學家第一次發現了人類皮膚的“尖叫”

科學家第一次發現了人類皮膚的“尖叫”

熱門閱讀

  • 當涉及體重減輕時,腹部脂肪的類型最重要 2025-03-06
  • 加工的植物性食物會像動物產品一樣增加體重增加嗎? 2025-03-14
  • 大腦變化在腦震蕩的運動員被清除後很長時間持續 2025-03-27
  • 咖啡因愛好者評選的七大最健康咖啡品牌 2024-02-23
  • 為什麼簡單的硬幣翻轉足以改變我們對待他人的方式 2025-02-13
  • 每個人都應該聽的 5 個最佳真實犯罪播客 2024-09-16
  • 專家警告說,減肥藥物會導致骨骼和肌肉損失 2024-12-24
  • 最終,對阿茲海默症早期階段進行準確的血液檢測可能即將到來 2025-01-08
  • 什麼是生態旅遊?定義、範例以及優缺點 2024-11-23
  • 5 用家中現有的材料DIY化妝刷清潔劑 2024-10-26

上升趨勢

  • PlayStation 6便攜式?索尼會加速該項目 2025-04-18
  • “但是是什麼?” »:特朗普將馬斯克排除在與中國戰爭的秘密簡報之外 2025-04-18
  • 高速公路上的150 km/h在AI幫助下,這是合理的嗎? 2025-04-18
  • Android 16(Beta)到達新智能手機:完整列表 2025-04-18
  • 這57個鍍鉻擴展可以在600萬檯面上監視,並緊急卸載它們 2025-04-18
  • 中國康科德“ C949”被揭示:它是簽名的,是空中客車和波音的競爭對手 2025-04-18
  • 根據ANSSI的說法,針對法國的網絡攻擊目前正在針對公共交通 2025-04-18
  • 01net早晨:最好的“魔術橡皮”,奧迪Q6 e-tron的超級力量,與chatgpt保持友善很昂貴 2025-04-18
  • Android 16:Google糾正了鏡頭,最後放回了這個基本的捷徑 2025-04-18
  • 它將像熱門蛋糕一樣銷售:Redmi Note 14 Pro以令人難以置信的價格( 2025-04-18

最近發布

  • 14 種令人驚訝的含有動物產品的食物 2024-10-25
  • 研究顯示地球最古老的大陸地殼正在崩解 2024-09-28
  • 「有毒」精液可能使蚊子交配致命以遏制疾病傳播 2025-01-09
  • 全新的Chevy Corvette在Costco上最多可享受3,000美元的折扣 2025-02-26
  • 研究發現,常見病症可能會使勃起功能障礙的風險加倍 2025-01-10
  • Ram 和康明斯將合作關係延長至 2030 年 2025-01-17
  • 不僅僅是幻覺:研究揭示了近死亡經驗的生物學基礎 2025-04-02
  • Vedran Bileta:關於作者 2025-04-01
  • 當涉及體重減輕時,腹部脂肪的類型最重要 2025-03-06
  • Happier Camper 推出最新、最實惠的旅行拖車 2025-02-13

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜