โปรแกรม Tacotron 2 สามารถสร้างเสียงพูดที่เป็นธรรมชาติจนแยกไม่ออกจากการบันทึกของมนุษย์
ในภาพยนตร์ของเธอโดย Spike Jonze เสียงเทียมของ Samantha น่าเชื่อมากจนตัวละครหลักตกหลุมรักเธอ มุมมองอาจจะไม่บ้ามาก: Google เพิ่งส่งไปยังชุมชนวิทยาศาสตร์กบทความรายงานความก้าวหน้าในการสังเคราะห์เสียงพูด ด้วยระบบ Tacotron 2 ของเขา เขาจึงสามารถประสบความสำเร็จในการสร้างสตรีมเสียงด้วยผลลัพธ์ที่เป็นธรรมชาติจนไม่สามารถแยกความแตกต่างจากเสียงของมนุษย์ได้
เพื่อเป็นการพิสูจน์ ต่อไปนี้เป็นสองประโยคที่แต่ละประโยคอ่านโดย Tacotron 2 และพนักงานของ Google คุณสามารถมองเห็นเสียงเทียมได้หรือไม่?
ตัวอย่างหมายเลขหนึ่งด้วย:ผู้หญิงคนนั้นทำวิดีโอเกี่ยวกับลิปสติกของ Star Wars
คำตอบ: เสียง 1 เป็นมนุษย์และเสียง 2 เป็นเสียงเทียม
ตัวอย่างหมายเลข 2 ด้วยเธอได้รับปริญญาเอกด้านสังคมวิทยาจากมหาวิทยาลัยโคลัมเบีย
คำตอบในครั้งนี้คือ เสียง 1 เป็นเสียงของมนุษย์ และเสียง 2 เป็นมนุษย์
ไม่พบมันเหรอ? มันเป็นเรื่องปกติ นอกจากนี้ ในระหว่างการคำนวณคะแนนตัวเลือกเฉลี่ยซึ่งตัดสินคุณภาพของการสร้างเสียงของตัวแปลงสัญญาณเสียง Tacotron 2 ได้รับคะแนนดีเยี่ยมที่ 4.53 ซึ่งเกือบจะเหมือนกับเวอร์ชันของมนุษย์ซึ่งสูงถึง 4.58
โครงข่ายประสาทสองอันในที่ทำงาน
Tacotron 2 มีพื้นฐานอยู่บนโครงข่ายประสาทเทียมสองโครง ขั้นแรกจะแบ่งข้อความออกเป็นลำดับต่างๆ และแปลงข้อความแต่ละรายการเป็นสเปกโตรแกรม กล่าวคือ แผนภาพแสดงความเข้มของความถี่เสียงด้วยสายตา อย่างที่สองเรียกว่า WaveNet จะสร้างไฟล์เสียงโดยอัตโนมัติ ความพิเศษของมันคือการได้รับการพัฒนาโดยดีพมายด์บริษัทปัญญาประดิษฐ์ชื่อดังที่เป็นเจ้าของโดยอัลฟาเบ็ต WaveNet ทำให้เสียงภาษาอังกฤษและภาษาญี่ปุ่นของ Google Assistant ทำงานโดยใช้วิธีการเรียนรู้แบบไม่มีผู้ดูแล: ไม่ต้องอาศัยฐานข้อมูลขนาดใหญ่ที่ขับเคลื่อนโดยการบันทึกของนักแสดง มีการใช้เวอร์ชันที่มีสถาปัตยกรรมที่ปรับเปลี่ยนเล็กน้อยที่นี่ WaveNet ทำหน้าที่เป็นโวโคเดอร์เพื่อสังเคราะห์รูปคลื่นชั่วคราวจากสเปกโตแกรม
Tacotron 2 ทรงพลังมากจนสามารถจัดการกับคำที่ออกเสียงยากได้อย่างง่ายดาย และสามารถปรับระดับเสียงและความเร็วในการพูดได้อย่างละเอียด นอกจากนี้ยังปรับเปลี่ยนน้ำเสียงตามเครื่องหมายวรรคตอน เช่น เน้นคำที่เขียนด้วยตัวพิมพ์ใหญ่
เสียใจเล็กน้อยเหมือนกัน ปัจจุบัน Tacotron 2 แสดงออกมาด้วยเสียงผู้หญิงและเป็นภาษาอังกฤษเท่านั้น หากต้องการพูดด้วยเสียงผู้หญิงหรือเสียงผู้ชาย ปัญญาประดิษฐ์จะต้องได้รับการฝึกฝนอีกครั้ง มันยังเหลือหนทางอีกเล็กน้อยก่อนที่จะได้รับประโยชน์จากแอปพลิเคชันอย่าง Google Assistant
🔴 เพื่อไม่ให้พลาดข่าวสารจาก 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-