Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

突破后,大型语言模型可以被压缩到你的手机上,而不需要数千台服务器来运行

  • 2024-12-05
  • Armanda

强大的ChatGPT 等 (AI) 模型需要大量电力才能运行,因此它们通常位于大型数据中心中。但一项新的突破可以压缩这些人工智能模型,使其适合智能手机或笔记本电脑。

一种名为“校准感知低精度分解与低秩适应”(CALDERA) 的新算法通过修剪代码中的冗余并降低其信息层的精度来压缩运行大型语言模型 (LLM) 所需的大量数据。

研究合著者表示:“任何时候,只要你能够降低使用人工智能模型的计算复杂性、存储和带宽要求,你就可以在无法处理此类计算和内存密集型任务的设备和系统上启用人工智能。”安德里亚·戈德史密斯普林斯顿大学电气与计算机工程系教授在一份报告中表示陈述。

科学家在研究中表示,每当有人在手机或笔记本电脑上使用 ChatGPT(举一个流行的例子)时,提出的任何请求都会发送到巨大的远程服务器,在那里处理数据会付出巨大的环境和财务成本。这是因为这种规模的 AI 模型会消耗大量的处理能力,因为它们需要使用数百个甚至数千个组件,例如图形处理单元 (GPU)。因此,要在小型设备上使用单个 GPU 执行这些请求,必须压缩 AI 模型的大小和范围。

有关的:

为了压缩 LLM,CALDERA 结合了两种技术。科学家们表示,第一种技术是“低精度”,它减少了用于存储信息的位数(数据的 1 和 0),从而加快了存储和处理速度,同时提高了能源效率。第二个称为“低等级”,是指减少训练法学硕士时使用的可学习参数的冗余。

“我们提出了一种用于压缩大型数据集或大型矩阵的通用算法。然后我们意识到,现在不仅数据集很大,而且部署的模型也越来越大。因此,我们也可以使用我们的算法来压缩这些模型,”研究合著者拉贾什·萨哈斯坦福大学博士生在声明中说道。 “结合使用这两种特性,我们能够获得比这两种技术单独实现的压缩率更高的压缩率。”

该团队在 Meta 的开源 Llama 2 和 Llama 3 模型上测试了该算法,与仅使用这两种技术之一的现有压缩算法相比,性能提高了高达 5%。研究结果可能为未来法学硕士在智能手机或笔记本电脑上存储和运行铺平道路,特别是在隐私至关重要且不需要最高精确度的情况下。

然而,科学家们警告说,法学硕士并未针对在此类设备上高效运行进行优化。

“如果你正在攻读法学硕士,而你的手机在一小时内就没电了,你不会高兴的。但我不会说有一种技术可以解决所有问题,”萨哈在声明中说。 “我们在本文中提出的是一种与先前工作中提出的技术结合使用的技术。我认为这种组合将使我们能够更有效地在移动设备上使用法学硕士并获得更准确的结果。”

相關貼文

数学家设计了新的问题来挑战高级人工智能的推理能力

数学家设计了新的问题来挑战高级人工智能的推理能力

目前世界上最强大的 9 台超级计算机

目前世界上最强大的 9 台超级计算机

巨大的蒸汽羽流从阿拉斯加山山山升起,火山边缘更接近喷发

巨大的蒸汽羽流从阿拉斯加山山山升起,火山边缘更接近喷发

灵长类动物:关于包括人类,猿类,猴子和其他近亲的事实

灵长类动物:关于包括人类,猿类,猴子和其他近亲的事实

Labord's Chameleon:变色的蜥蜴在4个月内死亡

Labord's Chameleon:变色的蜥蜴在4个月内死亡

火山喷发结束数百万年后,“隐秘碳”可能会泄漏

火山喷发结束数百万年后,“隐秘碳”可能会泄漏

在Vesuvius爆发后,人的大脑如何转向玻璃的谜团可能解决了

在Vesuvius爆发后,人的大脑如何转向玻璃的谜团可能解决了

数十亿年前火星的热水中是否存在外星生命?

数十亿年前火星的热水中是否存在外星生命?

4个雪豹在稀有镜头中一起发现在偏远的巴基斯坦山上

4个雪豹在稀有镜头中一起发现在偏远的巴基斯坦山上

熱門閱讀

  • 中国有2200年历史的坟墓包含“丝绸之路的红色公主”,其牙齿用有毒物质涂漆 2025-03-12
  • 保护农作物:基于RNA的物质开辟了新的途径,以抗击广泛的植物病毒 2025-03-19
  • 一种扭曲的蛋白质揭示了鹿的慢性消耗性疾病 2024-11-12
  • 科学家发现两颗恒星同步围绕银河系超大质量黑洞运行 2024-12-20
  • 行星研究人员研究潮汐对行星及其卫星内部的影响 2024-11-07
  • DeepFake检测平台推断Cheq收购 2025-01-31
  • ID4AFRICA宣布2025个大使班,反映了不断增长的法律ID影响 2025-02-05
  • 2024 年干旱后水鸟数量几乎减少一半 2024-12-17
  • 美国浪费了与中国赢得AI比赛所需的一种资源 2025-04-01
  • Idemia Secure Transactions 为 Serenity 的生物识别门禁卡提供支持 2024-11-28

上升趨勢

  • 01net早晨:最好的“魔術橡皮”,奧迪Q6 e-tron的超級力量,與chatgpt保持友善很昂貴 2025-04-18
  • 唐納德·特朗普(Donald Trump)在半導體上收緊絞索...對美國經濟的冒險賭注 2025-04-18
  • 全球變暖慢慢污染了世界飲食的支柱之一 2025-04-18
  • 它以30i/s的速度拍攝8K,135分鐘的自主權:Insta360 X4售罄,並將比賽投入了比賽。 2025-04-18
  • 發現一個新血統:為什麼它可以挽救生命 2025-04-18
  • Freebox Pop S機器引誘橙色,Bouygues和SFR訂戶 2025-04-18
  • 中國康科德“ C949”被揭示:它是簽名的,是空中客車和波音的競爭對手 2025-04-18
  • 這不是iPad,但性能很瘋狂,價格便宜2倍 2025-04-18
  • 發行人:有必要盡快撤回您的錢嗎?我們將真實脫離了錯誤 2025-04-18
  • 這是Moing V,第一個折疊式閱讀器 2025-04-18

最近發布

  • 美国和哥伦比亚与生物识别数据共享协议加深了安全关系 2025-04-01
  • 驾车者:您的灰卡上的简单细节可能会花费您巨大的费用,这是检查以避免罚款的地方 2025-02-07
  • 2023 年 Windows PC 10 个最佳恶意软件删除工具 2022-12-22
  • PC 和移动设备的最新安全新闻和更新 2024-12-11
  • 7 最佳 Google 床單鍛煉模板 2023-07-23
  • 出乎意料的是,《GTA》即将登陆 Netflix! 2023-11-29
  • 攻击进行中! Elementor 的 Essential Addons 遭遇严重故障 2023-05-15
  • 金士顿 金士顿 DataTraveler G4 64 Go 对比 IStorage DatAshur SD 512 Go 2024-12-08
  • 如何使用虚拟 dj 8 配置 numark idj3 2024-01-30
  • 如何使用微软的默认应用程序“照片”删除重复项? 2022-03-02

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜