Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

突破後,大型語言模型可以被壓縮到你的手機上,而不需要數千台服務器來運行

  • 2024-12-05
  • Armanda

強大的ChatGPT 等 (AI) 模型需要大量電力才能運行,因此它們通常位於大型數據中心中。但一項新的突破可以壓縮這些人工智能模型,使其適合智能手機或筆記本電腦。

一種名為“校準感知低精度分解與低秩適應”(CALDERA) 的新算法通過修剪代碼中的冗餘並降低其信息層的精度來壓縮運行大型語言模型 (LLM) 所需的大量數據。

研究合著者表示:“任何時候,只要你能夠降低使用人工智能模型的計算複雜性、存儲和帶寬要求,你就可以在無法處理此類計算和內存密集型任務的設備和系統上啟用人工智能。”安德里亞·戈德史密斯普林斯頓大學電氣與計算機工程系教授在一份報告中表示陳述。

科學家在研究中表示,每當有人在手機或筆記本電腦上使用 ChatGPT(舉一個流行的例子)時,提出的任何請求都會發送到巨大的遠程服務器,在那里處理數據會付出巨大的環境和財務成本。這是因為這種規模的 AI 模型會消耗大量的處理能力,因為它們需要使用數百個甚至數千個組件,例如圖形處理單元 (GPU)。因此,要在小型設備上使用單個 GPU 執行這些請求,必須壓縮 AI 模型的大小和範圍。

有關的:

為了壓縮 LLM,CALDERA 結合了兩種技術。科學家們表示,第一種技術是“低精度”,它減少了用於存儲信息的位數(數據的 1 和 0),從而加快了存儲和處理速度,同時提高了能源效率。第二個稱為“低等級”,是指減少訓練法學碩士時使用的可學習參數的冗餘。

“我們提出了一種用於壓縮大型數據集或大型矩陣的通用算法。然後我們意識到,現在不僅數據集很大,而且部署的模型也越來越大。因此,我們也可以使用我們的算法來壓縮這些模型,”研究合著者拉賈什·薩哈斯坦福大學博士生在聲明中說道。 “結合使用這兩種特性,我們能夠獲得比這兩種技術單獨實現的壓縮率更高的壓縮率。”

該團隊在 Meta 的開源 Llama 2 和 Llama 3 模型上測試了該算法,與僅使用這兩種技術之一的現有壓縮算法相比,性能提高了高達 5%。研究結果可能為未來法學碩士在智能手機或筆記本電腦上存儲和運行鋪平道路,特別是在隱私至關重要且不需要最高精確度的情況下。

然而,科學家們警告說,法學碩士並未針對在此類設備上高效運行進行優化。

“如果你正在攻讀法學碩士,而你的手機在一小時內就沒電了,你不會高興的。但我不會說有一種技術可以解決所有問題,”薩哈在聲明中說。 “我們在本文中提出的是一種與先前工作中提出的技術結合使用的技術。我認為這種組合將使我們能夠更有效地在移動設備上使用法學碩士並獲得更準確的結果。”

相關貼文

科學家可能剛剛發現了300個宇宙中最稀有的黑洞

科學家可能剛剛發現了300個宇宙中最稀有的黑洞

研究發現,我們本能地會對貼有「人工智慧生成」標籤的故事感到厭煩

研究發現,我們本能地會對貼有「人工智慧生成」標籤的故事感到厭煩

我們認為這是有史以來最好的DLSR,尼康D850現在以其有史以來最優惠的價格

我們認為這是有史以來最好的DLSR,尼康D850現在以其有史以來最優惠的價格

首次分析後揭示了亞歷山大大帝馬賽克的秘密

首次分析後揭示了亞歷山大大帝馬賽克的秘密

NASA 解開了木星木衛一火山活動如此活躍的 44 年之謎

NASA 解開了木星木衛一火山活動如此活躍的 44 年之謎

如果氣候變遷得不到遏制,到 2100 年地球上三分之一的物種可能會滅絕

如果氣候變遷得不到遏制,到 2100 年地球上三分之一的物種可能會滅絕

美國太空總署再次推遲歷史性的阿爾忒彌斯任務

美國太空總署再次推遲歷史性的阿爾忒彌斯任務

數據顯示,2024 年是有紀錄以來最熱的一年,也是第一個突破攝氏 1.5 度全球暖化限制的年份

數據顯示,2024 年是有紀錄以來最熱的一年,也是第一個突破攝氏 1.5 度全球暖化限制的年份

距離地球 129 億光年的超大質量黑洞

距離地球 129 億光年的超大質量黑洞

熱門閱讀

  • 每週:復活冷凍的大腦;巨型小行星前往地球;您確實有一個“甜點胃” 2025-02-12
  • 如何在飲食中獲得omega-3和omega-6的正確平衡 2025-02-12
  • 為什麼服用減肥藥比以往任何時候都重要 2025-03-26
  • 新研究發現,釀造茶可以清除水中的鉛和其他重金屬。 2025-02-26
  • AI科學家對現代模型將導致AGI表示懷疑 2025-03-07
  • 挑戰:南極安全:設計 NASA 月球救援系統 2024-12-31
  • 細菌如何用休眠病毒的遺傳物質“接種”自己 2025-03-22
  • 美國太空總署再次推遲歷史性的阿爾忒彌斯任務 2024-12-06
  • 受自然啟發的設計使用彈性柱噴射冷凍液滴,防止結冰 2025-01-15
  • 烏克蘭人對AS-90 Howitzer感到滿意 2025-04-04

上升趨勢

  • 騙局,深擊,加密貨幣:Google在2024年封鎖了51億個廣告 2025-04-18
  • Freebox Pop S機器引誘橙色,Bouygues和SFR訂戶 2025-04-18
  • 認識Zhúlóng,這是銀河系的“雙胞胎”,搖晃我們的宇宙時間表 2025-04-17
  • 中國康科德“ C949”被揭示:它是簽名的,是空中客車和波音的競爭對手 2025-04-18
  • 這是Moing V,第一個折疊式閱讀器 2025-04-18
  • 橙色後機:Livebox 6已經回來了 2025-04-18
  • 放開您的iPhone,這個單置13至 2025-04-18
  • Android 16(Beta)到達新智能手機:完整列表 2025-04-18
  • 它以30i/s的速度拍攝8K,135分鐘的自主權:Insta360 X4售罄,並將比賽投入了比賽。 2025-04-18
  • 全球變暖慢慢污染了世界飲食的支柱之一 2025-04-18

最近發布

  • 到 2022 年,公共雲服務市場的經濟規模將達到 3312 億美元 2023-07-14
  • 2025年流媒體電影的13個最佳免費應用 2025-01-30
  • 如何使用多種不同的工具輕鬆混合兩張臉 2023-07-15
  • 如何在 Android 上設定自拍桿 2024-01-25
  • 如何在 Windows 10 / 11 中依大小對資料夾進行排序 2022-11-08
  • 北卡羅來納州最好的小鎮:從藍嶺到海岸 2025-02-27
  • 10 個向視頻添加音樂的最佳應用程序(Android y iOS) 2023-07-17
  • 在 Windows XP 中調整螢幕尺寸 [教學] 2023-10-27
  • 如何在 Windows 11 中設定預設視窗大小 2024-09-28
  • Windows 11 22H2 和 23H2 已知問題與解決方法 2024-07-24

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜