生成人工智慧小世界中的風暴。一個不知名的中國聊天機器人 DeepSeek 憑藉其開發成本 600 萬美元的開源技術躍居 App Store 排行榜榜首……結果與 ChatGPT 接近。
美國人工智慧界存在恐慌,「人造衛星時刻「, 曾是擔心唐納德·川普 (Donald Trump) 的投資者兼親密顧問馬克·安德森 (Marc Andreessen) 談到 1957 年蘇聯發射的第一顆衛星,這讓美國大吃一驚。一個中國聊天機器人,深度搜尋,連續多日位居全球最受歡迎免費應用程式排行榜榜首。
大衛與歌利亞
機器人 DeepSeek-R1 提供的最先進的語言模型 (LLM) 會比o1 模型,OpenAI 最先進的,根據 DeepSeek 進行的基準測試,在數學和推理問題上。預設情況下,該聊天機器人在 DeepSeek-V3 上運行,據報導其開發成本不到 600 萬美元。設計高性能法學碩士所需的數千億美元只是杯水車薪,該領域的美國巨頭不斷被提醒——例如透過「星際之門」計畫。
DeepSeek 有這個小大衛擊敗歌利亞的一面,這可能會動搖美國(和歐洲)行業的確定性:由於其開源模型使用比西方冠軍的晶片效率低的晶片計算,因此中國機器人會做得更好......甚至更少親愛的。根據 Epoch AI 的說法,DeepSeek 的模型非常高效,訓練它只需要 Meta 的 Llama 3.1 模型的十分之一的計算能力。
中國機器人也意味著對某些「敏感」請求的限制。例如,無法向 DeepSeek 詢問有關天安門廣場起義或有關習近平的問題。
自2021年以來,由於白宮的限制,在中國獲得最先進的美國矽片變得非常複雜。為了能夠繼續工作,中國的人工智慧開發人員互相分享他們的工作並嘗試新的方法。 “DeepSeek 專注於透過軟體解決方案優化資源»,解釋為有線Marina 張,雪梨科技大學副教授。
這位中國技術專家繼續說道:「DeepSeek採用開源方法,匯集集體專業知識並促進協作創新。這種方法不僅克服了資源限制,而且加速了尖端技術的開發,這使 DeepSeek 與更封閉的競爭對手區分開來»。
DeepSeek於2023年由梁文峰在杭州創立。這位電子工程師組裝了 10,000 個 Nvidia H100 晶片的電池,這些晶片現已禁止進口到中國。在此基礎設施中,將添加仍可導入的功能較弱的晶片,並進行最佳化以限製成本並降低培訓法學碩士所需的運算能力。
DeepSeek的成功對西方人工智慧產業來說是一個真正的震撼。中國的例子也許會推動它更多地合作,並利用現有基礎設施尋求更高的效率。
來源 : 有線