Skip to content
  • 熱門
  • 趨勢
  • 精選

Forgot Password?

← Back to login
世界圖譜
世界圖譜
  • 熱門
  • 趨勢
  • 精選
登入
訂閱
世界圖譜
世界圖譜

人工智能會出現認知衰退嗎?研究表明聊天機器人隨著時間的推移會失去準確性

  • 2025-02-17
  • Elinore

隨著醫療診斷越來越多地使用人工智能 (AI),一項新研究引起了人們對其長期一致性的擔憂。該研究於 12 月 20 日發布,表明大型語言模型 (LLM) 和基於人工智能的聊天機器人可能會遭受,與人類相似。

這一發現削弱了人類醫生將很快被人工智能取代的想法,並識別了醫療診斷中可能存在的威脅。

人工智能使醫療診斷更快

布雷特·喬丹/Unsplash

人工智能通過快速分析病史、X 射線和其他數據集,在異常現像被人眼察覺之前檢測到異常,從而徹底改變了醫療保健。

這些進步顯著提高了診斷速度和準確性。然而,最近的一項研究表明,人工智能驅動的聊天機器人,包括 OpenAI 的 ChatGPT、Anthropic 的 Sonnet 和 Alphabet 的 Gemini,可能會隨著時間的推移而失去有效性。生活科學。

測試人工智能的認知能力

為了確定人工智能係統是否患有認知能力下降,研究人員利用蒙特利爾認知評估(MoCA)測試。該測試通常被神經科醫生用來評估人類的認知能力,量化以下領域的能力:

  • 注意力和記憶力
  • 語言與抽象
  • 空間技能和執行功能

該測試涉及諸如反復從 100 中減去 7、記住閱讀列表中的項目以及在鐘面上標記給定時間等活動。對於人類來說,30 中的 26 代表正常的認知狀態,低於該值可能表明認知缺陷。

人工智能聊天機器人如何評分

結果英國醫學雜誌研究呈現出顯著的趨勢。 ChatGPT-4 的得分最高,為 26 分(滿分 30 分),達到了人類正常認知功能的水平。 Gemini 1.0 的成功率要低得多,只有 16 分,表明舊版本的 LLM 認知功能惡化。

雖然人工智能在命名、注意力和語言測試中表現最好,但在空間和執行功能測試中表現不佳,尤其是延遲回憶和抽象思維。

人工智能真的會出現認知衰退嗎?

雖然結果表明舊人工智能模型的性能下降,但科學家警告說,這些發現只是觀察性的。人工智能處理數據的方式本質上與人腦不同,因此兩者不能輕易進行比較。該研究仍然表明,人工智能係統可能存在缺陷,可能會阻止它們在醫療診斷中充分發揮作用。

主要問題之一是人工智能在視覺抽象和執行功能任務方面表現不佳,而這兩個領域對於健全的醫療診斷至關重要。如果人工智能聊天機器人無法可靠地解碼複雜的視覺信息,那麼它們在臨床環境中的應用可能會受到破壞。

人工智能對醫療保健的影響

這些結果對人工智能在醫學領域的未來具有明顯的影響。雖然人工智能是一種極其強大的工具,但在重要的診斷功能中完全依賴它之前,需要克服它的局限性。一些要點是:

人工智能不應該取代人類醫生,而應該幫助他們。人工智能可以快速掃描大量數據,但需要人工干預才能正確解釋。

定期更新和再培訓是必要的。由於舊的人工智能模型效率較低,更新法學碩士對於確保准確性非常重要。

人工智能可能需要“神經檢查”。人工智能本身接受認知測試的幽默想法為定期檢查以保證持續的可靠性打開了大門。

人工智能用戶的現實檢驗

儘管人工智能在醫學領域取得了長足的進步,但這項研究提醒我們,技術並不完美。人工智能可能遭受“認知衰退”的建議清楚地表明它需要人類的微調和監督。

相關貼文

Apple Intelligence:需要代筆撰寫論文、電子郵件嗎? iOS 18.2 為您擴展了書寫工具

Apple Intelligence:需要代筆撰寫論文、電子郵件嗎? iOS 18.2 為您擴展了書寫工具

Nintendo Switch 2 預購主機價格提前曝光-會更貴嗎?

Nintendo Switch 2 預購主機價格提前曝光-會更貴嗎?

Google Gemini在Gmail中帶來了新的“添加到日曆”按鈕,但是有一些警告

Google Gemini在Gmail中帶來了新的“添加到日曆”按鈕,但是有一些警告

需要新的三星手機嗎? Galaxy 以舊換新方案將為您的舊裝置帶來價值

需要新的三星手機嗎? Galaxy 以舊換新方案將為您的舊裝置帶來價值

SpaceX 再次發射! Optus-X 衛星從佛羅裡達州射入軌道

SpaceX 再次發射! Optus-X 衛星從佛羅裡達州射入軌道

亞馬遜賣家因費用低廉而嘗試 TikTok Shop,但即將到來的 TikTok 禁令能阻止他們嗎?

亞馬遜賣家因費用低廉而嘗試 TikTok Shop,但即將到來的 TikTok 禁令能阻止他們嗎?

埃隆·馬斯克(Elon Musk)vs. Openai:億萬富翁威脅要跌入97b $ 97b的收購競標

埃隆·馬斯克(Elon Musk)vs. Openai:億萬富翁威脅要跌入97b $ 97b的收購競標

2025 年 5 款最佳靜態程式碼分析工具

2025 年 5 款最佳靜態程式碼分析工具

內部人士稱《孤島驚魂 7》被推遲,育碧在發行新遊戲方面遇到困難

內部人士稱《孤島驚魂 7》被推遲,育碧在發行新遊戲方面遇到困難

熱門閱讀

  • 如何更改Windows 10工作列圖示大小[教學] 2023-12-28
  • 下載 Windows、Mac、Web 的 Cobalt 2024-12-02
  • 測試顯示 Snapdragon 8 Elite 可顯著提升 Android 電池續航時間 2025-01-10
  • 如何在2025年阻止 /跳過Hulu廣告[4種方式] 2025-03-10
  • AI 現在也與 Microsoft 記事本集成 2024-12-14
  • Packard Bell iPower 8007 對比 Dell Alienware Aurora R9 2024-12-12
  • VIBE編碼101:您的AI驅動編程指南 2025-03-26
  • DeepSeek發現的安全缺陷導致越獄 2025-01-28
  • 雷諾 R5 電動車:價格、發布日期、選項,您需要了解的一切 2022-04-12
  • 三星 Galaxy Grand Plus 與 Blackview Hero 10 2024-12-08

上升趨勢

  • 騙局,深擊,加密貨幣:Google在2024年封鎖了51億個廣告 2025-04-18
  • 有了這個項目,MG希望以不到20,000歐元的價格出售電動汽車 2025-04-18
  • 高速公路上的150 km/h在AI幫助下,這是合理的嗎? 2025-04-18
  • 這57個鍍鉻擴展可以在600萬檯面上監視,並緊急卸載它們 2025-04-18
  • 認識Zhúlóng,這是銀河系的“雙胞胎”,搖晃我們的宇宙時間表 2025-04-17
  • 發行人:有必要盡快撤回您的錢嗎?我們將真實脫離了錯誤 2025-04-18
  • Netflix在法國大大提高了其價格,這造成了很多傷害! 2025-04-18
  • Android 16:Google糾正了鏡頭,最後放回了這個基本的捷徑 2025-04-18
  • DeepSeek將在美國取景器中:這是特朗普政府可以宣布的 2025-04-18
  • 維基百科剛剛給AI部門贈送了巨大的禮物 2025-04-18

最近發布

  • Java 執行時期環境 11 (JRE) 2024-11-30
  • 這個被低估但風景優美的小鎮是加州通往優勝美地國家公園的門戶 2025-01-04
  • 伊利諾州的這些小鎮擁有最好的歷史街區 2023-11-15
  • 海水作為漚製劑:提取香蕉纖維的可持續方法 2024-09-27
  • 150 萬年前,肯亞至少有兩種古人類共存 2024-11-28
  • 中西部的「德國」是明尼蘇達州最被低估的城鎮 2024-11-19
  • 聯合航空公司(United Airlines)與Starlink進行飛行:FAA批准的Wi-Fi噴氣式飛機準備五月發布 2025-04-01
  • 2024 年 11 月最佳儲蓄帳戶利率 2024-11-11
  • RAM將1500 Laramie / Laramie Night Edition介紹給阿根廷 2025-03-14
  • 如何在 Epic Games Launcher 上顯示為離線(快速且簡單) 2024-12-27

Copyright © 2024 世界圖譜

  • 關於本網站
  • 隱私權政策
  • 服務條款
  • 世界圖譜