แบบจำลอง AI ที่มีอายุมากกว่าแสดงสัญญาณของการลดลงของความรู้ความเข้าใจการศึกษาแสดงให้เห็น

ผู้คนพึ่งพามากขึ้นเรื่อย ๆ(AI) สำหรับการวินิจฉัยทางการแพทย์เนื่องจากเครื่องมือเหล่านี้เร็วและมีประสิทธิภาพสามารถมองเห็นความผิดปกติและสัญญาณเตือนในประวัติศาสตร์ทางการแพทย์รังสีเอกซ์และชุดข้อมูลอื่น ๆ ก่อนที่พวกเขาจะเห็นได้ชัดกับตาเปล่า แต่การศึกษาใหม่ตีพิมพ์ 20 ธันวาคม 2567 ในBMJทำให้เกิดความกังวลว่าเทคโนโลยี AI เช่นโมเดลภาษาขนาดใหญ่ (LLMS) และ chatbots เช่นผู้คนแสดงสัญญาณของความสามารถทางปัญญาที่เสื่อมสภาพตามอายุ

"การค้นพบเหล่านี้ท้าทายสมมติฐานที่ว่าปัญญาประดิษฐ์จะเข้ามาแทนที่แพทย์มนุษย์ในไม่ช้า" ผู้เขียนการศึกษาเขียนไว้ในบทความ "เนื่องจากความบกพร่องทางสติปัญญาที่เห็นได้ชัดใน Chatbots ชั้นนำอาจส่งผลกระทบต่อความน่าเชื่อถือในการวินิจฉัยทางการแพทย์และบ่อนทำลายความเชื่อมั่นของผู้ป่วย"

นักวิทยาศาสตร์ได้ทดสอบแชทบอทที่ขับเคลื่อนด้วย LLM รวมทั้ง OpenAi, Sonnet ของ Anthropic และ Alphabet's Gemini โดยใช้การประเมินความรู้ความเข้าใจมอนทรีออลการทดสอบ (MOCA) - ชุดของงานนักประสาทวิทยาที่ใช้เพื่อทดสอบความสามารถในความสนใจ, หน่วยความจำ, ภาษา, ทักษะเชิงพื้นที่และการทำงานทางจิตของผู้บริหาร

MOCA มักใช้ในการประเมินหรือทดสอบการเริ่มต้นของความบกพร่องทางสติปัญญาในสภาพเช่นโรคอัลไซเมอร์หรือภาวะสมองเสื่อม วิชาที่ได้รับงานเช่นการวาดเวลาที่เฉพาะเจาะจงบนใบหน้านาฬิกาเริ่มต้นที่ 100 และลบเจ็ดซ้ำ ๆ ซ้ำ ๆ จดจำคำมากที่สุดเท่าที่จะเป็นไปได้จากรายการที่พูดและอื่น ๆ ในมนุษย์ 26 จาก 30 ถือว่าเป็นคะแนนผ่าน (เช่นเรื่องไม่มีความบกพร่องทางสติปัญญา

ที่เกี่ยวข้อง:

ในขณะที่บางแง่มุมของการทดสอบเช่นการตั้งชื่อความสนใจภาษาและสิ่งที่เป็นนามธรรมดูเหมือนจะง่ายสำหรับ LLMs ส่วนใหญ่ที่ใช้พวกเขาทั้งหมดทำงานได้ไม่ดีในทักษะการมองเห็น/เชิงพื้นที่และงานผู้บริหาร

อย่างมากในขณะที่รุ่นล่าสุดของ CHATGPT (เวอร์ชัน 4) ทำคะแนนสูงสุด (26 จาก 30), Gemini 1.0 LLM ที่เก่ากว่าได้คะแนนเพียง 16 - นำไปสู่ข้อสรุป LLM ที่เก่ากว่าแสดงสัญญาณของการลดลงของความรู้ความเข้าใจ

รับการค้นพบที่น่าสนใจที่สุดในโลกที่ส่งตรงไปยังกล่องจดหมายของคุณ

ผู้เขียนการศึกษาทราบว่าการค้นพบของพวกเขาเป็นเพียงการสังเกต - ความแตกต่างที่สำคัญระหว่างวิธีการที่ AI และการทำงานในจิตใจของมนุษย์หมายถึงการทดลองไม่สามารถเปรียบเทียบได้โดยตรง แต่พวกเขาเตือนว่ามันอาจชี้ไปที่สิ่งที่พวกเขาเรียกว่า "พื้นที่สำคัญของความอ่อนแอ" ที่สามารถทำให้เบรกในการติดตั้ง AI ในการแพทย์ทางคลินิก โดยเฉพาะพวกเขาแย้งกับการใช้ AI ในงานที่ต้องใช้สิ่งที่เป็นนามธรรมและฟังก์ชั่นผู้บริหาร

นอกจากนี้ยังเพิ่มความคิดที่ค่อนข้างน่าขบขันของนักประสาทวิทยาของมนุษย์ที่ใช้ในตลาดใหม่ทั้งหมด - AIS ตัวเองที่มีสัญญาณของความบกพร่องทางสติปัญญา

相關貼文