แบบจำลองนี้ทำให้สามารถแปลภาษาหนึ่งเป็นอีกภาษาหนึ่งได้ในขณะที่ยังคงเสียงและจังหวะของผู้พูดดั้งเดิม โดยไม่ต้องผ่านการถอดเสียงเป็นลายลักษณ์อักษร
Google เพิ่งนำเสนอ Translatotron โมเดลที่สามารถแปลคำพูดจากภาษาหนึ่งเป็นอีกภาษาหนึ่งได้โดยตรง โซลูชันการสังเคราะห์เสียงพูดของเครื่องมือแปลไม่เพียงแต่จำลองเสียงของผู้พูดเท่านั้น แต่ยังรวมถึงจังหวะของผู้พูดด้วย นี่คือสิ่งที่ Google เรียกว่า "การแปลโดยตรง"
Translatotron รับการป้อนข้อมูลด้วยเสียง ประมวลผลเป็นสเปกตรัม ซึ่งเป็นการแสดงความถี่ด้วยภาพ และสร้างสเปกตรัมใหม่ในภาษาเป้าหมาย ผลลัพธ์ที่ได้คือการแปลที่รวดเร็วยิ่งขึ้นและมีโอกาสเกิดข้อผิดพลาดน้อยลง
ไม่ต้องผ่านการเขียนอีกต่อไป
ระบบการแปลคำพูดเป็นคำพูดมีอยู่แล้วในอดีต แต่พวกเขาถอดคำพูดเป็นข้อความเพื่อแปล จากนั้นจึงสร้างเสียงสังเคราะห์เพื่ออ่านผลลัพธ์ ปัญหาคือขั้นตอนต่างๆ เหล่านี้เป็นสาเหตุของข้อผิดพลาดและทำให้ความเร็วในการดำเนินการช้าลง ผลลัพธ์ของ Google Translatotron ยังคงเป็นหุ่นยนต์เล็กน้อยและยังห่างไกลจากความสมบูรณ์แบบ แต่ผลลัพธ์นี้แสดงถึงความก้าวหน้าอย่างแท้จริง และท้ายที่สุดจะเป็นประโยชน์ต่อ Google แปลภาษา
แหล่งที่มา :บล็อกปัญญาประดิษฐ์ของ Google
🔴 เพื่อไม่ให้พลาดข่าวสารจาก 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-
Opera One - เว็บเบราว์เซอร์ที่ขับเคลื่อนด้วย AI
โดย: โอเปร่า