大規模總楊百翰研究人員領導的一項研究揭示了chatgpt在臨床決策中。
研究表明,大型語言模型(LLM)AI Chatbot在整體臨床決策中達到了約72%的精度,包括從產生潛在診斷到最終診斷和護理管理選擇的任務。
該研究包括各種醫學專業,並在初級保健和緊急情況下進行。

可與新生醫學專業人員相提並論
首席作者馬里蘭州馬克·史克斯(Marc Succi)表示,Chatgpt的表現與剛畢業的醫療專業人員相當,強調了LLMS在醫學領域中充當有效工具的潛力。
“不存在真正的基準,但是我們估計這種表現處於剛剛從醫學院畢業的人(例如實習生或居民)的水平。這告訴我們,LLM通常有可能成為醫學實踐的增強工具,並以令人印象深刻的準確性來支持臨床決策,” Succi''在一份聲明中說。
儘管人工智能取得了迅速的進步,但LLM可以在多大程度上促進全面的臨床護理。
這項研究試圖調查Chatgpt在整個患者相遇中為臨床決策提供建議和做出臨床決策的能力,包括診斷工作,臨床管理和最終診斷。
該研究涉及將標準化臨床方案的細分市場展示給CHATGPT,並模擬現實世界中的患者互動。 Chatgpt的任務是根據初始患者信息生成差異診斷,然後通過連續的數據輸入進行管理決策並最終診斷。
研究人員發現,Chatgpt的準確性平均約為72%,在最終診斷為77%時,其表現最高。但是,它在做出鑑別診斷(60%)和臨床管理決策(68%)方面的準確性較低。
值得注意的是,該研究表明,Chatgpt的反應並未證明性別偏見,並且在初級和緊急護理方案中其表現是一致的。
Succi強調,Chatgpt在鑑別診斷方面苦苦掙扎,這是醫學的重要方面,需要在面對有限的患者信息時確定潛在的行動方案。它指出了醫生在患者護理的早期階段的優勢,在患者護理的早期階段產生了可能的診斷列表是關鍵的。
在臨床實踐中
該研究的作者承認,在將Chatgpt之類的工具集成到臨床實踐中之前,進一步的基準研究和監管指導至關重要。該團隊的未來工作旨在探索AI工具是否可以在資源受限的醫療機構中增強患者護理。
綜合的學術衛生系統和創新企業大眾楊百翰(Mass General Brigham)積極從事嚴格的研究,以負責任地將AI納入護理,勞動力支持和行政流程中。
合著者亞當·蘭德曼(Adam Landman),醫學博士,MIS,MIS,首席信息官兼Mass General Brigham Digital副總裁MHS強調,此類研究在評估AI解決方案的準確性,可靠性,安全性和公平性在整合到臨床護理中的準確性,可靠性,安全性和公平性。
蘭德曼在一份聲明中說:“大規模楊百翰將LLMS的巨大希望有助於改善護理服務和臨床醫生的經驗。”研究的發現是出版在《醫學互聯網研究雜誌》中。
