Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

利用人工智能發現氣候錯誤信息需要經過專業訓練的模型

  • 2025-04-14
  • Noble

利用人工智能發現氣候錯誤信息需要經過專業訓練的模型

Meta 的 Llama 和 Google 的 Gemini 在任務中落後於專有的

一項新的研究表明,想要利用人工智能對抗氣候錯誤信息的組織需要聘請專家來指導模型的訓練。

羅布·多比/Moment/Getty Images Plus

對話式人工智能聊天機器人讓氣候錯誤信息聽起來更加可信,讓人們更難區分謊言和真實科學。作為回應,氣候專家正在使用一些相同的工具來檢測在線虛假信息。

但在對虛假或誤導性氣候聲明進行分類時,通用大型語言模型或 LLM(例如 Meta 的 Llama 和 OpenAI 的 GPT-4)落後了根據專家策劃的氣候數據專門訓練的模型,科學家們三月份在費城舉行的 AAAI 人工智能會議上報告說。調查結果顯示,希望在聊天機器人和內容審核工具中使用常用的法學碩士來檢查氣候錯誤信息的氣候組織需要仔細考慮他們使用的模型,並聘請相關專家來指導培訓過程。

與其他類型的索賠相比,伊利諾伊州埃文斯頓西北大學的通信專家埃里克·尼斯貝特(Erik Nisbet)表示,這些信息經常“被虛假或誤導性的科學信息所掩蓋”,這使得人類和機器更難發現氣候科學的複雜性。

為了評估模型,尼斯貝特和他的同事使用名為 CARDS 的數據集,其中包含來自 53 個氣候懷疑論網站和博客的大約 28,900 個英文段落。這些段落分為五類:“全球變暖沒有發生”、“人類溫室氣體不會導致全球變暖”、“氣候影響還不錯”、“氣候解決方案行不通”和“氣候運動/科學不可靠”。

研究人員通過對來自同一數據集的約 26,000 個段落重新訓練或微調 OpenAI 的 GPT-3.5-turbo3 建立了針對氣候的法學碩士。然後,該團隊將經過微調的專有模型與 16 個通用法學碩士和在 CARDS 數據集上訓練的公開可用的小型語言模型 (RoBERTa) 的性能進行了比較。這些模型對其餘 2,900 段誤導性主張進行了分類。

Nisbet 的團隊通過對每個模型將聲明分類到正確類別的程度進行評分來評估模型。經過微調的 GPT 模型在測量量表上得分為 0.84(滿分 1.00)。通用 GPT-4o 和 GPT-4 模型的得分較低,分別為 0.75 和 0.74,與小型 RoBERTa 模型的 0.77 得分相當。這表明在訓練期間包含專家反饋可以提高分類性能。但測試的其他非專有模型,例如 Meta 和 Mistral 的模型,表現不佳,得分僅為 0.28。

維也納複雜性科學中心的錯誤信息專家漢娜·梅茨勒 (Hannah Metzler) 表示,這是一個顯而易見的結果。研究人員在使用非專有模型時面臨計算限制,無法使用更強大的模型。 “這表明,如果你沒有巨大的資源(氣候組織不會擁有),如果你不想使用專有模型,當然就會出現問題,”她說。 “這表明政府非常需要創建開源模型並為我們提供使用該模型的資源。”

研究人員還測試了微調模型和 CARDS 訓練模型,對低可信度網站在 Facebook 和 X 上發布的 914 段有關氣候變化的虛假聲明進行分類。經過微調的 GPT 模型的分類與兩位氣候通信專家標記的類別高度一致,並且優於 RoBERTa 模型。但是,GPT 模型很難對氣候變化對動植物影響的說法進行分類,這可能是由於訓練數據中缺乏足夠的例子。

另一個問題是通用模型可能無法跟上共享信息的變化。 “氣候錯誤信息不斷變化和適應,”梅茨勒說,“追趕它總是很困難。”

科學新聞的更多故事

相關貼文

利用馬鈴薯的遺傳特性可能會減少肥料需求

利用馬鈴薯的遺傳特性可能會減少肥料需求

一個混亂的身體時鐘可能比缺乏睡眠更大的問題

一個混亂的身體時鐘可能比缺乏睡眠更大的問題

海豚?一項研究稱,玩耍時張開嘴的行為就像微笑

海豚?一項研究稱,玩耍時張開嘴的行為就像微笑

你的大腦可以透過一次嗅覺感知到微妙的氣味變化

你的大腦可以透過一次嗅覺感知到微妙的氣味變化

甚至史詩般的降雨也可能不足以補充Socal的含水層

甚至史詩般的降雨也可能不足以補充Socal的含水層

出土的冰可能是北極最古老的埋藏冰川遺跡

出土的冰可能是北極最古老的埋藏冰川遺跡

火星土豆狀的衛星可能是一顆被撕碎的小行星的殘骸

火星土豆狀的衛星可能是一顆被撕碎的小行星的殘骸

中國著名的豐富恐龍化石床有了新的起源故事

中國著名的豐富恐龍化石床有了新的起源故事

科學家預測俄勒岡州附近的海底火山將於 2025 年爆發

科學家預測俄勒岡州附近的海底火山將於 2025 年爆發

熱門閱讀

  • “我們沒有陷入困境”:宇航員“卡在太空中”使唱片保持直截了當 2025-02-17
  • OpenID 基金會呼籲私營部門和公共部門就 mDL 進行合作 2024-12-17
  • 對 19,898 個 Kickstarter 活動的分析發現,談論政治會損害籌款 2024-09-20
  • 對於我們來說,減慢氣候變暖為時已晚? 2025-04-14
  • 中國以比最強大的超級計算機快1四倍的新芯片來實現量子至上的主張 2025-03-13
  • 「黑暗旅遊」正在吸引遊客前往以色列和烏克蘭的戰區和暴行地點。為什麼? 2024-09-27
  • 古老的樹木年輪揭示了每 1000 年一次的神秘輻射風暴 2022-10-28
  • 全球研究合作打造出新型獨特的聚變反應器 2024-09-20
  • 利用磁鬆弛:「吃豆人效應」能精確組織超順磁珠 2024-09-24
  • 在適當的條件下,雷射光束可以投射陰影 2024-11-14

上升趨勢

  • 中國康科德“ C949”被揭示:它是簽名的,是空中客車和波音的競爭對手 2025-04-18
  • 這57個鍍鉻擴展可以在600萬檯面上監視,並緊急卸載它們 2025-04-18
  • Intel Core i9,24 GB的RAM,SSD 1 TO TO,此迷你PC Bmax以微不足道的價格是一個純粹的掘金 2025-04-18
  • 唐納德·特朗普(Donald Trump)在半導體上收緊絞索...對美國經濟的冒險賭注 2025-04-18
  • 這款功能強大的大型口袋PC比Mac Mini便宜2倍,是一台Dinguerie😱 2025-04-18
  • 發現一個新血統:為什麼它可以挽救生命 2025-04-18
  • 維基百科剛剛給AI部門贈送了巨大的禮物 2025-04-18
  • 有了這個項目,MG希望以不到20,000歐元的價格出售電動汽車 2025-04-18
  • 個性化您的三星星係以前從未有過:最終在Google Play上的終極工具 2025-04-18
  • 外星人生活的最有力的證據尚未發現124光年 2025-04-17

最近發布

  • 利用磁鬆弛:「吃豆人效應」能精確組織超順磁珠 2024-09-24
  • 2025 年最實用、最平衡的插電式油電混合車 2025-01-21
  • 克里斯托弗·麥克爾梅爾(Christopher McElmeel) 2025-02-26
  • CERN 物理學家首次發現反超氦 4 的證據 2024-12-16
  • 富含澱粉的植物性食物在 78 萬年前的古人類飲食中發揮核心作用 2025-01-07
  • 小心哈雷戴維森,印度的新型旅行自行車即將推出 2025-01-17
  • 在大峽谷「發現」古埃及象形文字的考古學家 2023-06-23
  • 智人早在150,000年前就住在非洲濕的熱帶森林中 2025-02-26
  • 一張巨型圖表顯示全球半導體產業的價值 2025-01-03
  • Tokay Gecko:關於這種非常受歡迎且迷人的蜥蜴的 15 個有趣事實 2024-12-23

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜