ChatGPT, Google Bard, Claude และ AI อื่นๆ ทั้งหมดมีข้อบกพร่องหนึ่งประการที่เหมือนกัน ตามที่ผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ระบุว่า ความล้มเหลวนี้เสี่ยงต่อผู้ใช้บางรายมากกว่าผู้อื่น... คำอธิบาย
เจเนอเรชั่นเอไอ เช่นChatGPT, Google Bard และ Claude จาก Anthropic มีข้อบกพร่องด้านการออกแบบเหมือนกัน ตามที่ผู้เชี่ยวชาญ AI หลายคนสัมภาษณ์โดย Wired โมเดลทางภาษาที่ทำหน้าที่เป็นพื้นฐานสำหรับแชทบอทมีแนวโน้มที่จะเน้นย้ำการครอบงำของภาษาอังกฤษเมื่อเทียบกับสำนวนที่ได้รับความนิยมน้อยกว่า
อ่านเพิ่มเติม:OpenAI ทำลายสถิติที่น่าประทับใจด้วย ChatGPT
AI ซึ่งเป็นเทคโนโลยีที่พูดภาษาอังกฤษเป็นหลัก
ในการฝึกโมเดล AI บริษัทต่างๆ เช่น OpenAI หรือ Google ใช้เนื้อหาจากอินเทอร์เน็ต ฐานข้อมูลเหล่านี้ส่วนใหญ่ประกอบด้วยข้อความที่เขียนเป็นภาษาอังกฤษซึ่งยังคงเป็นภาษาที่แพร่หลายที่สุดบนเว็บ การศึกษาของรัฐบุรุษยังระบุด้วยว่าเว็บไซต์มากกว่า 63% ได้รับการตีพิมพ์ในภาษาของเช็คสเปียร์
ตัวอย่างเช่น,GPT-4ซึ่งเป็นเวอร์ชันล่าสุดของโมเดล AI ของ OpenAI มีพื้นฐานมาจาก“ข้อมูลก่อนการฝึก”ในภาษาอังกฤษ OpenAI ยอมรับ นอกจากนี้ ยังได้วางมาตรการบรรเทาผลกระทบที่มุ่งควบคุม AI และหลีกเลี่ยงการละเมิดอีกด้วย“ด้วยมุมมองของสหรัฐฯ เป็นศูนย์กลาง”-
โดยพฤตินัย หุ่นยนต์สนทนาก็คือมีประสิทธิภาพ แม่นยำ และมีประโยชน์มากขึ้นเมื่อสื่อสารกับผู้ใช้อินเทอร์เน็ตที่พูดภาษาอังกฤษ ท้ายที่สุดแล้ว บุคคลที่พูดภาษาอื่นโดยเฉพาะจะเริ่มต้นจากการเสียเปรียบอย่างร้ายแรง พวกเขาไม่สามารถได้รับประโยชน์ 100% จากนวัตกรรมปัญญาประดิษฐ์ทั้งหมด
“ข้อกังวลที่ใหญ่ที่สุดประการหนึ่งของฉันคือเราจะทำให้อคติของผู้พูดภาษาอังกฤษรุนแรงขึ้น”เตือน Thien Huu Nguyen นักวิทยาศาสตร์คอมพิวเตอร์จากมหาวิทยาลัย Oregon ที่ได้รับการติดต่อจากสื่อ
ChatGPT ไม่เก่งภาษาต่างประเทศ
จากการค้นพบของ Thien Huu Nguyen พบว่าแชทบอทคือมีพรสวรรค์น้อยลงอย่างเห็นได้ชัดเมื่อพวกเขาสร้างการตอบกลับในภาษาอื่นที่ไม่ใช่ภาษาอังกฤษ AI ยังคงมีปัญหาอย่างมากในการเปลี่ยนจากภาษาหนึ่งไปอีกภาษาหนึ่งหรือสรุปข้อความที่เขียนเป็นภาษาต่างประเทศ เมื่อถูกถามในภาษาอื่น ChatGPT มักจะเป็นเช่นนั้นบ่อยกว่า“ภาพหลอน”กล่าวคือต้องประดิษฐ์ข้อมูลที่ผิดพลาด หรือเพื่อหาคำตอบที่คลุมเครือ บ่งบอกถึงการทดลองที่ดำเนินการโดย Nguyen และนักวิจัยของเขา
ยิ่งภาษาในโลกแพร่หลายน้อยลง ภาษาก็จะยิ่งปรากฏในข้อมูลที่ป้อนด้วย AI น้อยลงเท่านั้น เป็นผลให้แชทบอทมีแนวโน้มที่จะให้คำตอบที่เกี่ยวข้องในภาษาถิ่นที่ไม่คุ้นเคยน้อยลงตามกลไก... ซึ่งเสี่ยงต่อการตกตะกอนความเสื่อมโทรมของภาษาเหล่านี้- ในเวลาเดียวกันสองภาษาที่มีคนพูดมากที่สุดในโลก ได้แก่ ภาษาอังกฤษและภาษาจีนกลาง เสี่ยงที่จะใช้ประโยชน์จากการเพิ่มขึ้นของปัญญาประดิษฐ์เพื่อสร้างการครอบงำที่สำคัญอยู่แล้ว
การใช้ภาษาอังกฤษอยู่ทั่วไปทุกหนทุกแห่งก็เสี่ยงที่จะเกิดอันตรายเช่นกันการกลั่นกรองในภาษาอื่น ด้วยการมุ่งเน้นไปที่ความหมายของคำในภาษาที่เป็นที่รู้จักมากที่สุด AI จะพลาดคำศัพท์ที่อาจไม่เหมาะสมหรือดูถูกในภาษาถิ่นอื่น ตามที่ Center for Democracy & Technology องค์กรในอเมริกา ชี้ให้เห็นถึงอัลกอริธึมการตรวจจับที่ใช้โดยยักษ์ใหญ่ด้านเทคโนโลยี เช่น Meta (เฟสบุ๊ค) มีประสิทธิภาพโดยเฉพาะในภาษาอังกฤษ บ่อยครั้งเนื้อหาในภาษาอาหรับมักถูกเข้าใจผิดว่าแสดงความเกลียดชัง เบื้องหลังข้อผิดพลาดทั่วไปเหล่านี้ เราพบว่าไม่มีข้อความดิจิทัลที่ทำให้ AI และอัลกอริทึมสามารถฝึกอบรมในภาษาอื่นได้ สำหรับภาษาถิ่นบางภาษา เช่น ฮินดีและอินโดนีเซีย มีทรัพยากรไม่เพียงพอที่จะฝึกโมเดลต่างๆ ด้วยเหตุนี้ การกลั่นกรองเนื้อหา ไม่ว่าจะเป็นบนโซเชียลเน็ตเวิร์กหรือแชทบอท จึงไม่มีประสิทธิภาพเท่ากับในภาษาอังกฤษ... ซึ่งเปิดโอกาสให้เกิดการละเมิดได้
การปรับปรุงในสายตา
บริษัทที่อยู่เบื้องหลัง AI ได้ตระหนักถึงช่องว่างนี้จึงได้ดำเนินการ Sam Altman ซีอีโอและผู้ร่วมก่อตั้ง OpenAI แสดงความตั้งใจที่จะร่วมมือกับรัฐบาลต่างๆ เพื่อปรับปรุงความรู้ภาษาต่างประเทศของ ChatGPT
ในส่วนของ Google ได้เปลี่ยนแปลงการปรับแต่งไปแล้วPaLM 2 โมเดล AI ล่าสุดที่ประกาศโดยยักษ์ใหญ่ด้านการค้นหาได้รับการฝึกอบรมด้วยเนื้อหาที่เขียนด้วยภาษาที่หลากหลาย ด้วยคลังข้อมูลการฝึกอบรมนี้ โมเดลจึงรองรับภาษาต่างๆ ได้ประมาณร้อยภาษา ขออภัย ผู้ใช้อินเทอร์เน็ตยังไม่สามารถเข้าถึงการปรับปรุงด้านภาษาเหล่านี้ได้ ตอนนี้,Bard แชทบอทที่ขับเคลื่อนโดย PaLMเข้าใจเฉพาะภาษาอังกฤษ ญี่ปุ่น และเกาหลีเท่านั้น ในทำนองเดียวกันฟีเจอร์บางอย่างที่ขับเคลื่อนด้วย AI เช่น “ช่วยฉันเขียน” ของ Gmail มีให้บริการเฉพาะผู้พูดภาษาอังกฤษเท่านั้น
เพื่อหลีกเลี่ยงอคติทางภาษาใน AI นักวิจัยแนะนำให้ป้อนโมเดลด้วย“ข้อมูลสังเคราะห์”- อันที่จริงสิ่งเหล่านี้เป็นการแปลเนื้อหาที่เขียนครั้งแรกเป็นภาษาอังกฤษและแปลงเป็นภาษาที่ไม่รู้จัก วิธีการนี้น่าจะทำให้สามารถต่อสู้กับข้อความภาษาอังกฤษที่มีอยู่ทั่วไปทุกหนทุกแห่ง Thien Huu Nguyen เชื่อ หากไม่มีข้อมูลสรุปนี้ก็จะไม่มี“ข้อมูลในภาษาอื่นไม่เพียงพอ”,สรุปผู้วิจัย.
🔴 เพื่อไม่ให้พลาดข่าวสารจาก 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-
Opera One - เว็บเบราว์เซอร์ที่ขับเคลื่อนด้วย AI
โดย: โอเปร่า
แหล่งที่มา : แบบมีสาย