Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

利用人工智能发现气候错误信息需要经过专业训练的模型

  • 2025-04-14
  • Noble

利用人工智能发现气候错误信息需要经过专业训练的模型

Meta 的 Llama 和 Google 的 Gemini 在任务中落后于专有的

一项新的研究表明,想要利用人工智能对抗气候错误信息的组织需要聘请专家来指导模型的训练。

罗布·多比/Moment/Getty Images Plus

对话式人工智能聊天机器人让气候错误信息听起来更加可信,让人们更难区分谎言和真实科学。作为回应,气候专家正在使用一些相同的工具来检测在线虚假信息。

但在对虚假或误导性气候声明进行分类时,通用大型语言模型或 LLM(例如 Meta 的 Llama 和 OpenAI 的 GPT-4)落后了根据专家策划的气候数据专门训练的模型,科学家们三月份在费城举行的 AAAI 人工智能会议上报告说。调查结果显示,希望在聊天机器人和内容审核工具中使用常用的法学硕士来检查气候错误信息的气候组织需要仔细考虑他们使用的模型,并聘请相关专家来指导培训过程。

与其他类型的索赔相比,伊利诺伊州埃文斯顿西北大学的通信专家埃里克·尼斯贝特(Erik Nisbet)表示,这些信息经常“被虚假或误导性的科学信息所掩盖”,这使得人类和机器更难发现气候科学的复杂性。

为了评估模型,尼斯贝特和他的同事使用名为 CARDS 的数据集,其中包含来自 53 个气候怀疑论网站和博客的大约 28,900 个英文段落。这些段落分为五类:“全球变暖没有发生”、“人类温室气体不会导致全球变暖”、“气候影响还不错”、“气候解决方案行不通”和“气候运动/科学不可靠”。

研究人员通过对来自同一数据集的约 26,000 个段落重新训练或微调 OpenAI 的 GPT-3.5-turbo3 建立了针对气候的法学硕士。然后,该团队将经过微调的专有模型与 16 个通用法学硕士和在 CARDS 数据集上训练的公开可用的小型语言模型 (RoBERTa) 的性能进行了比较。这些模型对其余 2,900 段误导性主张进行了分类。

Nisbet 的团队通过对每个模型将声明分类到正确类别的程度进行评分来评估模型。经过微调的 GPT 模型在测量量表上得分为 0.84(满分 1.00)。通用 GPT-4o 和 GPT-4 模型的得分较低,分别为 0.75 和 0.74,与小型 RoBERTa 模型的 0.77 得分相当。这表明在训练期间包含专家反馈可以提高分类性能。但测试的其他非专有模型,例如 Meta 和 Mistral 的模型,表现不佳,得分仅为 0.28。

维也纳复杂性科学中心的错误信息专家汉娜·梅茨勒 (Hannah Metzler) 表示,这是一个显而易见的结果。研究人员在使用非专有模型时面临计算限制,无法使用更强大的模型。 “这表明,如果你没有巨大的资源(气候组织不会拥有),如果你不想使用专有模型,当然就会出现问题,”她说。 “这表明政府非常需要创建开源模型并为我们提供使用该模型的资源。”

研究人员还测试了微调模型和 CARDS 训练模型,对低可信度网站在 Facebook 和 X 上发布的 914 段有关气候变化的虚假声明进行分类。经过微调的 GPT 模型的分类与两位气候通信专家标记的类别高度一致,并且优于 RoBERTa 模型。但是,GPT 模型很难对气候变化对动植物影响的说法进行分类,这可能是由于训练数据中缺乏足够的例子。

另一个问题是通用模型可能无法跟上共享信息的变化。 “气候错误信息不断变化和适应,”梅茨勒说,“追赶它总是很困难。”

科学新闻的更多故事

相關貼文

地质学家发现了西海岸著名断层最危险的部分

地质学家发现了西海岸著名断层最危险的部分

一种新的铁化合物提示“原始”氦藏在地球核心中

一种新的铁化合物提示“原始”氦藏在地球核心中

胰腺癌血液测试称为pac-mann可以早日发现该疾病

胰腺癌血液测试称为pac-mann可以早日发现该疾病

喂鲨鱼“垃圾食品”会给他们的健康造成损失

喂鲨鱼“垃圾食品”会给他们的健康造成损失

越来越多的证据表明,社交媒体损害青少年的心理健康。现在怎么办?

越来越多的证据表明,社交媒体损害青少年的心理健康。现在怎么办?

技术亿万富翁对AI主导的未来的愿景是有缺陷的,而且很危险

技术亿万富翁对AI主导的未来的愿景是有缺陷的,而且很危险

购买碳信用额以应对气候变化?这是要知道的

购买碳信用额以应对气候变化?这是要知道的

与Maya的对话:Anna-Katrina Shedletsky

与Maya的对话:Anna-Katrina Shedletsky

大盐湖的活性粉尘可能会对健康造成影响

大盐湖的活性粉尘可能会对健康造成影响

熱門閱讀

  • 锤头鲨的饮食可能会影响它们是否漫游或待在家里 2025-03-21
  • 制造商如何优化电动汽车范围? [解释了6个关键方面] 2024-09-05
  • 光的形状:“物理学中以前从未见过的东西” 2024-11-21
  • 美国国家航空航天局 (NASA) 指挥官苏尼·威廉姆斯 (Suni Williams) 在国际空间站上会见有触手的 Astrobee 机器人 2024-12-19
  • 研究:吃这种蛋白质可以减缓心力衰竭的进展 2024-12-07
  • 全球研究合作打造出新型独特的聚变反应堆 2024-09-20
  • 114 TBPS光学容量:LightMatter通过革命性光子超芯片提高AI连接 2025-04-01
  • 地幔波将大陆向上托起,并在上面镶满钻石 2024-08-26
  • 这种“在黑暗中的光芒”电池在核废料上运行 2025-02-27
  • DNA 纳米技术揭示复杂的蛋白质相互作用,为癌症诊断提供信息 2024-09-20

上升趨勢

  • Freebox Pop S機器引誘橙色,Bouygues和SFR訂戶 2025-04-18
  • PlayStation 6便攜式?索尼會加速該項目 2025-04-18
  • 認識Zhúlóng,這是銀河系的“雙胞胎”,搖晃我們的宇宙時間表 2025-04-17
  • 有了這個項目,MG希望以不到20,000歐元的價格出售電動汽車 2025-04-18
  • 這不是iPad,但性能很瘋狂,價格便宜2倍 2025-04-18
  • 個性化您的三星星係以前從未有過:最終在Google Play上的終極工具 2025-04-18
  • 對於Google,Pixel 9a與庸俗的iPhone不可媲美16 2025-04-18
  • 暗物質的新形式可能解釋了銀河系的核心奧秘 2025-04-17
  • 這款功能強大的大型口袋PC比Mac Mini便宜2倍,是一台Dinguerie😱 2025-04-18
  • 外星人生活的最有力的證據尚未發現124光年 2025-04-17

最近發布

  • 我们可能终于知道为什么章鱼的大脑如此复杂 2022-03-18
  • 亚利桑那州 66 号公路沿线的这个路边车站是美国风情的缩影 2024-09-27
  • 待机时的连接状态:已断开连接、NIC 合规性 2024-06-13
  • 如何在 Epic Games Launcher 上显示为离线(快速且简单) 2025-03-04
  • 如何更改 iPhone 上的日期和时间 2024-11-15
  • 睡眠新科学:无论您的生活方式如何,如何睡得更好 2025-01-14
  • 研究发现,马达加斯加的采矿热潮造成的森林砍伐并不比农业造成的森林砍伐更多 2024-09-21
  • 如何在 Windows 10/11 上启用浅色主题 2024-05-03
  • 不,红葡萄酒对您的健康不比白色更健康 2025-03-10
  • 适用于 Windows 11 的应用程序 2024-12-18

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜