AI สามารถถอดรหัสการพูดจากการทำงานของสมองด้วยความแม่นยำที่น่าประหลาดใจ

ปัญญาประดิษฐ์สามารถถอดรหัสคำและประโยคจากการทำงานของสมองด้วยความประหลาดใจ - แต่ก็ยัง จำกัด - ความแม่นยำ การใช้ข้อมูลกิจกรรมสมองเพียงไม่กี่วินาที AI คาดเดาสิ่งที่คนเคยได้ยิน มันแสดงคำตอบที่ถูกต้องใน 10 ความเป็นไปได้สูงสุดถึง 73 เปอร์เซ็นต์ของเวลานักวิจัยที่พบในการศึกษาเบื้องต้น

“ การแสดงของ AI อยู่เหนือสิ่งที่หลายคนคิดว่าเป็นไปได้ในขั้นตอนนี้” Giovanni Di Liberto นักวิทยาศาสตร์คอมพิวเตอร์ของ Trinity College Dublin ซึ่งไม่ได้มีส่วนร่วมในการวิจัยกล่าว

พัฒนาขึ้นที่ บริษัท แม่ของ Facebook, Meta ในที่สุด AI สามารถนำมาใช้เพื่อช่วยเหลือผู้คนหลายพันคนทั่วโลกไม่สามารถสื่อสารผ่านการพูดการพิมพ์หรือท่าทางนักวิจัยรายงาน 25 สิงหาคมที่ arxiv.org ซึ่งรวมถึงผู้ป่วยจำนวนมากในการใส่ใจน้อยที่สุด, ล็อคหรือ "สถานะพืช"-ตอนนี้เป็นที่รู้จักกันทั่วไปว่าอาการตื่นตัวที่ไม่ตอบสนอง-SN: 2/8/19-

เทคโนโลยีที่มีอยู่ส่วนใหญ่เพื่อช่วยให้ผู้ป่วยดังกล่าวสื่อสารกับการผ่าตัดสมองที่มีความเสี่ยงต่ออิเล็กโทรดฝัง วิธีการใหม่นี้“ สามารถเป็นเส้นทางที่มีศักยภาพในการช่วยเหลือผู้ป่วยที่มีการขาดดุลการสื่อสาร…โดยไม่ต้องใช้วิธีการรุกราน” นักประสาทวิทยา Jean-Rémi King นักวิจัยอภิมาน AI ในปัจจุบันที่école Normale Supérieureในปารีสกล่าว

กษัตริย์และเพื่อนร่วมงานของเขาได้ฝึกอบรมเครื่องมือการคำนวณเพื่อตรวจจับคำและประโยคในการบันทึกเสียงพูด 56,000 ชั่วโมงจาก 53 ภาษา เครื่องมือนี้หรือที่เรียกว่ารูปแบบภาษาเรียนรู้วิธีการรับรู้คุณสมบัติเฉพาะของภาษาทั้งในระดับที่ดี-คิดว่าตัวอักษรหรือพยางค์-และในระดับที่กว้างขึ้นเช่นคำหรือประโยค

ทีมใช้ AI กับรูปแบบภาษานี้กับฐานข้อมูลจากสี่สถาบันที่รวมถึงกิจกรรมสมองจากอาสาสมัคร 169 คน ในฐานข้อมูลเหล่านี้ผู้เข้าร่วมฟังเรื่องราวและประโยคต่าง ๆ จากตัวอย่างเช่น Ernest Hemingway'sชายชราและทะเลและ Lewis Carroll'sอลิซ-การผจญภัยในดินแดนมหัศจรรย์ในขณะที่สมองของผู้คนถูกสแกนโดยใช้ magnetoencephalography หรือ electroencephalography เทคนิคเหล่านั้นวัดส่วนประกอบแม่เหล็กหรือไฟฟ้าของสัญญาณสมอง

จากนั้นด้วยความช่วยเหลือของวิธีการคำนวณที่ช่วยอธิบายความแตกต่างทางกายภาพระหว่างสมองจริงทีมพยายามถอดรหัสสิ่งที่ผู้เข้าร่วมได้ยินโดยใช้ข้อมูลกิจกรรมสมองเพียงสามวินาทีจากแต่ละคน ทีมสั่งให้ AI จัดแนวเสียงพูดจากการบันทึกเรื่องราวไปจนถึงรูปแบบของการทำงานของสมองที่ AI คำนวณว่าสอดคล้องกับสิ่งที่ผู้คนได้ยิน จากนั้นทำการคาดการณ์เกี่ยวกับสิ่งที่บุคคลนั้นอาจได้ยินในช่วงเวลาสั้น ๆ นั้นได้รับมากกว่า 1,000 ความเป็นไปได้

การใช้ Magnetoencephalography หรือ MEG คำตอบที่ถูกต้องอยู่ใน 10 อันดับแรกของ AI คาดเดาได้ถึง 73 เปอร์เซ็นต์ของเวลานักวิจัยพบ ด้วย electroencephalography ค่านั้นลดลงไม่เกิน 30 เปอร์เซ็นต์ “ การแสดง [MEG] นั้นดีมาก” Di Liberto กล่าว แต่เขามองโลกในแง่ดีน้อยลงเกี่ยวกับการใช้งานจริง “ เราจะทำอย่างไรกับมันไม่มีอะไรเลยไม่มีอะไรเลย”

เหตุผลที่เขากล่าวคือ Meg ต้องการเครื่องจักรขนาดใหญ่และมีราคาแพง การนำเทคโนโลยีนี้มาสู่คลินิกจะต้องใช้นวัตกรรมทางวิทยาศาสตร์ที่ทำให้เครื่องถูกและใช้งานง่ายขึ้น

สิ่งสำคัญคือต้องเข้าใจว่า“ การถอดรหัส” มีความหมายอย่างไรในการศึกษานี้โจนาธานเบรนแนนนักภาษาศาสตร์ของมหาวิทยาลัยมิชิแกนในแอนอาร์เบอร์กล่าว คำนี้มักใช้เพื่ออธิบายกระบวนการถอดรหัสข้อมูลโดยตรงจากแหล่งที่มา - ในกรณีนี้คำพูดจากกิจกรรมสมอง แต่ AI สามารถทำสิ่งนี้ได้เพียงเพราะมันมีรายการ จำกัด ของคำตอบที่ถูกต้องที่เป็นไปได้เพื่อคาดเดา

“ ด้วยภาษานั่นจะไม่ตัดมันถ้าเราต้องการขยายการใช้งานจริงเพราะภาษาไม่มีที่สิ้นสุด” เบรนแนนกล่าว

ยิ่งไปกว่านั้น Di Liberto กล่าวว่า AI ถอดรหัสข้อมูลของผู้เข้าร่วมฟังเสียงซึ่งไม่เกี่ยวข้องโดยตรงกับผู้ป่วยอวัจนภาษา เพื่อให้เป็นเครื่องมือสื่อสารที่มีความหมายนักวิทยาศาสตร์จะต้องเรียนรู้วิธีการถอดรหัสจากการทำกิจกรรมสมองสิ่งที่ผู้ป่วยเหล่านี้ตั้งใจจะพูดรวมถึงการแสดงออกของความหิวโหยความรู้สึกไม่สบายหรือ "ใช่" หรือ "ไม่" ง่ายๆ

การศึกษาใหม่คือ“ การถอดรหัสการรับรู้การพูดไม่ใช่การผลิต” กษัตริย์เห็นด้วย แม้ว่าการผลิตคำพูดเป็นเป้าหมายสูงสุด แต่ตอนนี้“ เราค่อนข้างไกล”

เรื่องราวเพิ่มเติมจากข่าววิทยาศาสตร์เป็นต้นประสาทวิทยาศาสตร์

相關貼文