ในภาพยนตร์นิยายวิทยาศาสตร์เรื่อง Arrival ปี 2016 นักภาษาศาสตร์คนหนึ่งต้องเผชิญกับภารกิจอันน่าหวาดหวั่นในการถอดรหัสภาษาที่ประกอบด้วยวลีพาลินโดรม ซึ่งอ่านย้อนกลับแบบเดียวกับที่อ่านข้างหน้า เขียนด้วยสัญลักษณ์วงกลม ขณะที่เธอค้นพบเบาะแสต่างๆ ประเทศต่างๆ ทั่วโลกก็ตีความข้อความนั้นแตกต่างออกไป โดยที่บางคนสันนิษฐานว่าเป็นภัยคุกคาม
หากมนุษยชาติต้องตกอยู่ในสถานการณ์เช่นนี้ในปัจจุบัน ทางออกที่ดีที่สุดของเราคือการหันมาศึกษาวิจัยเพื่อหาคำตอบว่าทำอย่างไร(AI) พัฒนาภาษา
แต่อะไรคือสิ่งที่กำหนดภาษาอย่างแท้จริง? พวกเราส่วนใหญ่ใช้อย่างน้อยหนึ่งรายการเพื่อสื่อสารกับผู้คนรอบตัวเรา แต่มันเกิดขึ้นได้อย่างไร? นักภาษาศาสตร์กำลังไตร่ตรองคำถามนี้มานานหลายทศวรรษแต่ยังไม่มีวิธีที่ง่ายเพื่อดูว่าภาษามีวิวัฒนาการอย่างไร-
ภาษาเป็นเพียงเรื่องชั่วคราว จึงไม่ทิ้งร่องรอยใด ๆ ไว้ในบันทึกฟอสซิล ต่างจากกระดูก เราไม่สามารถขุดภาษาโบราณเพื่อศึกษาว่าภาษาเหล่านี้พัฒนาไปอย่างไรเมื่อเวลาผ่านไป
แม้ว่าเราอาจไม่สามารถศึกษาวิวัฒนาการที่แท้จริงของภาษามนุษย์ได้ แต่บางทีการจำลองอาจให้ข้อมูลเชิงลึกบางอย่างได้ นั่นคือที่มาของ AI — สาขาวิชาวิจัยที่น่าสนใจที่เรียกว่าการสื่อสารที่เกิดขึ้นที่ฉันใช้เวลาสามปีที่ผ่านมาเรียน
เพื่อจำลองการพัฒนาของภาษา เราได้มอบหมายงานง่ายๆ ให้กับตัวแทน (AI) ที่ต้องมีการสื่อสาร เช่น เกมที่หุ่นยนต์ตัวหนึ่งต้องนำทางอีกตัวหนึ่งไปยังตำแหน่งเฉพาะบนตารางโดยไม่ต้องแสดงแผนที่ เราจัดเตรียม (เกือบ) ไม่มีข้อจำกัดเกี่ยวกับสิ่งที่พวกเขาสามารถพูดหรืออย่างไร — เราเพียงแค่มอบหมายงานให้พวกเขาและปล่อยให้พวกเขาแก้ไขตามที่พวกเขาต้องการ
เนื่องจากการแก้ปัญหาเหล่านี้ต้องการให้เจ้าหน้าที่สื่อสารระหว่างกัน เราจึงสามารถศึกษาว่าการสื่อสารของพวกเขาพัฒนาไปอย่างไรเมื่อเวลาผ่านไป เพื่อให้เข้าใจว่าภาษาจะพัฒนาไปอย่างไร
ที่เกี่ยวข้อง:
คล้ายกันมีการทดลองกับมนุษย์แล้ว- ลองนึกภาพคุณซึ่งเป็นผู้พูดภาษาอังกฤษถูกจับคู่กับผู้ที่ไม่ใช่ภาษาอังกฤษ งานของคุณคือสั่งให้คู่ของคุณหยิบลูกบาศก์สีเขียวจากสิ่งของต่างๆ บนโต๊ะ
คุณอาจลองแสดงท่าทางเป็นรูปลูกบาศก์ด้วยมือแล้วชี้ไปที่หญ้านอกหน้าต่างเพื่อแสดงสีเขียว เมื่อเวลาผ่านไป คุณจะพัฒนาภาษาต้นแบบร่วมกัน บางทีคุณอาจสร้างท่าทางหรือสัญลักษณ์เฉพาะสำหรับ "คิวบ์" และ "สีเขียว" ผ่านการโต้ตอบซ้ำๆ สัญญาณชั่วคราวเหล่านี้จะได้รับการขัดเกลาและสม่ำเสมอมากขึ้น ก่อให้เกิดระบบการสื่อสารขั้นพื้นฐาน
สิ่งนี้ทำงานคล้ายกันสำหรับ AI ผ่านการลองผิดลองถูก พวกเขาเรียนรู้เพื่อสื่อสารเกี่ยวกับสิ่งของที่พวกเขาเห็น และคู่สนทนาของพวกเขาเรียนรู้ที่จะเข้าใจสิ่งเหล่านั้น
แต่เราจะรู้ได้อย่างไรว่าพวกเขากำลังพูดถึงอะไร? หากพวกเขาพัฒนาภาษานี้เฉพาะกับคู่สนทนาปลอมๆ ของพวกเขา ไม่ใช่กับเรา เราจะรู้ได้อย่างไรว่าแต่ละคำหมายถึงอะไร ท้ายที่สุดแล้ว คำที่เฉพาะเจาะจงอาจหมายถึง "สีเขียว" "ลูกบาศก์" หรือแย่กว่านั้น - ทั้งสองอย่าง ความท้าทายในการตีความนี้เป็นส่วนสำคัญของการวิจัยของฉัน
การแคร็กรหัส
งานทำความเข้าใจภาษา AI อาจดูเหมือนแทบจะเป็นไปไม่ได้เลยในตอนแรก หากฉันพยายามพูดภาษาโปแลนด์ (ภาษาแม่ของฉัน) กับเพื่อนร่วมงานที่พูดแต่ภาษาอังกฤษ เราก็ไม่เข้าใจกันหรือรู้ด้วยซ้ำว่าแต่ละคำเริ่มต้นและสิ้นสุดที่ใด
ความท้าทายของภาษา AI นั้นยิ่งใหญ่กว่า เนื่องจากอาจจัดระเบียบข้อมูลในลักษณะที่แตกต่างจากรูปแบบทางภาษาของมนุษย์อย่างสิ้นเชิง
โชคดีที่นักภาษาศาสตร์ได้พัฒนาช่ำชอง เครื่องมือการใช้ทฤษฎีสารสนเทศเพื่อแปลภาษาที่ไม่รู้จัก
เช่นเดียวกับที่นักโบราณคดีปะติดปะต่อภาษาโบราณจากชิ้นส่วนต่างๆ เราใช้รูปแบบในการสนทนาด้วย AI เพื่อทำความเข้าใจโครงสร้างทางภาษาของพวกเขา บางครั้งเราก็พบว่าความคล้ายคลึงกันที่น่าประหลาดใจกับภาษาของมนุษย์ และบางครั้งเราก็ค้นพบวิธีการสื่อสารที่แปลกใหม่โดยสิ้นเชิง-
เครื่องมือเหล่านี้ช่วยให้เรามองเข้าไปใน "กล่องดำ" ของการสื่อสาร AI ซึ่งเผยให้เห็นว่าตัวแทนเทียมพัฒนาวิธีการแบ่งปันข้อมูลที่เป็นเอกลักษณ์ของตนเองได้อย่างไร
งานล่าสุดของฉันมุ่งเน้นไปที่การใช้สิ่งที่ตัวแทนเห็นและพูดเพื่อแปลภาษาของพวกเขา ลองนึกภาพการมีสำเนาบทสนทนาในภาษาที่คุณไม่รู้จัก พร้อมด้วยสิ่งที่ผู้พูดแต่ละคนกำลังดูอยู่ เราสามารถจับคู่รูปแบบในบทถอดเสียงกับวัตถุในขอบเขตการมองเห็นของผู้เข้าร่วม สร้างความเชื่อมโยงทางสถิติระหว่างคำกับวัตถุ
ตัวอย่างเช่น บางทีวลี "yayo" เกิดขึ้นพร้อมกับนกที่บินผ่านมา เราอาจเดาได้ว่า "yayo" เป็นคำของผู้พูดที่แปลว่า "นก" ด้วยการวิเคราะห์รูปแบบเหล่านี้อย่างรอบคอบ เราสามารถเริ่มถอดรหัสความหมายเบื้องหลังการสื่อสารได้
ในกระดาษล่าสุดโดยฉันและเพื่อนร่วมงาน ในการปรากฏตัวในการประชุมของ Neural Information Processing Systems (NeurIPS) เราแสดงให้เห็นว่าวิธีการดังกล่าวสามารถนำไปใช้ในการทำวิศวกรรมย้อนกลับอย่างน้อยก็บางส่วนของภาษาและไวยากรณ์ของ AIs ซึ่งทำให้เราเข้าใจถึงวิธีที่พวกเขา อาจจัดโครงสร้างการสื่อสาร
มนุษย์ต่างดาวและระบบอัตโนมัติ
สิ่งนี้เชื่อมโยงกับมนุษย์ต่างดาวได้อย่างไร? วิธีที่เรากำลังพัฒนาเพื่อทำความเข้าใจภาษา AI สามารถช่วยให้เราถอดรหัสการสื่อสารของมนุษย์ต่างดาวในอนาคตได้
หากเราสามารถได้รับข้อความแปลกปลอมที่เป็นลายลักษณ์อักษรพร้อมกับบริบทบางอย่าง (เช่น ข้อมูลภาพที่เกี่ยวข้องกับข้อความ) เราก็สามารถทำได้ใช้เครื่องมือทางสถิติเดียวกันเพื่อวิเคราะห์พวกเขา แนวทางที่เรากำลังพัฒนาในวันนี้อาจเป็นเครื่องมือที่มีประโยชน์ในการศึกษาภาษาต่างประเทศในอนาคตที่เรียกว่า xenolinguistics
แต่เราไม่จำเป็นต้องค้นหามนุษย์ต่างดาวเพื่อได้รับประโยชน์จากการวิจัยนี้ มีแอปพลิเคชั่นมากมาย, จากการปรับปรุงโมเดลภาษาเช่น ChatGPT หรือ Claude เพื่อปรับปรุงการสื่อสารระหว่างยานพาหนะอัตโนมัติหรือโดรน-
ด้วยการถอดรหัสภาษาที่เกิดขึ้น เราสามารถทำให้เทคโนโลยีในอนาคตเข้าใจได้ง่ายขึ้น ไม่ว่าจะเป็นการรู้ว่ารถยนต์ที่ขับเคลื่อนด้วยตนเองประสานการเคลื่อนไหวอย่างไร หรือวิธีที่ระบบ AI ตัดสินใจ เราไม่เพียงแค่สร้างระบบอัจฉริยะเท่านั้น แต่เรากำลังเรียนรู้ที่จะเข้าใจพวกเขา
บทความแก้ไขนี้เผยแพร่ซ้ำจากการสนทนาภายใต้ใบอนุญาตครีเอทีฟคอมมอนส์ อ่านบทความต้นฉบับ-