หลังจากข้อความ รูปภาพ และวิดีโอ OpenAI กำลังจัดการกับเสียง ผู้สร้าง ChatGPT ได้เปิดเผยตัวอย่างเครื่องมือใหม่ที่เรียกว่า Voice Engine ซึ่งจะโคลนเสียงและสำเนียงใดๆ ก็ตาม สิ่งที่คุณต้องทำคือฟังเสียงต้นฉบับเป็นเวลา 15 วินาที มีเรื่องน่าประหลาดใจ...และน่ากังวล
หลังจาก ChatGPT และ Dall-E แล้ว OpenAI ก็สร้างความประหลาดใจให้กับ Sora เมื่อไม่กี่สัปดาห์ก่อน ซึ่งเป็น AI ที่สร้างวิดีโอที่สมจริงอย่างน่าทึ่งจากคำขอข้อความธรรมดา โมเดลก็จะมีจำหน่ายเช่นกันในระหว่างปี-
เสียงสมจริงที่น่ารำคาญ
แต่บริษัทในแคลิฟอร์เนียไม่ได้หยุดอยู่แค่นั้น:เธอได้นำเสนอ Voice Engine ซึ่งเป็นเครื่องมือใหม่ที่ช่วยให้สามารถโคลนเสียงได้ตั้งแต่การบันทึก 15 วินาที- ผลลัพธ์ที่ได้ก็ค่อนข้างน่าทึ่งเช่นกัน เสียงโคลนฟังดูสมจริงกับหูมาก โดยมีโทนเสียงที่เป็นธรรมชาติใกล้เคียงกับเสียงของโมเดล OpenAI ได้โพสต์สารสกัดหลายอย่างทางออนไลน์ในนั้นเว็บไซต์-
การพัฒนา Voice Engine เริ่มต้นในปี 2022 และอิงตามอินเทอร์เฟซการเขียนโปรแกรมข้อความเป็นคำพูดกระซิบซึ่งเป็นโมเดล AI ที่ยอดเยี่ยมที่ออกแบบมาเพื่อถอดเสียงและแปลคำพูดเป็นข้อความ API นี้ถูกใช้เพื่อพูดคุย ChatGPT แล้ว
ลีร์ChatGPT จะมาแทนที่ Google Assistant บนสมาร์ทโฟน Android ของคุณได้ในเร็วๆ นี้
OpenAI มีแนวคิดหลายประการในการใช้ Voice Engine: กลไกสามารถให้ความช่วยเหลือในการอ่านสำหรับเด็กและผู้ที่ไม่สามารถอ่านได้ เพื่อแปลเนื้อหา (ใช้ได้กับภาษาฝรั่งเศสด้วย); เพื่อสื่อสารกับผู้พูดภาษาที่พูดน้อย เพื่อช่วยเหลือคนที่เสียงหาย...
Voice Engine สามารถใช้เป็นส่วนหนึ่งของพอดแคสต์เสียง หรือแม้แต่ทางวิทยุ หรือสร้างหนังสือเสียงได้ (สร้างความผิดหวังให้กับผู้เชี่ยวชาญที่เป็นมนุษย์ในภาคส่วนเหล่านี้)เทคครันช์ทิศตะวันออกตกในระดับราคาที่ OpenAI สามารถเรียกเก็บได้: 15 ดอลลาร์สำหรับหนึ่งล้านตัวอักษร (ประมาณ 162,500 คำ ซึ่งเทียบเท่ากับโอลิเวอร์ ทวิสต์โดยดิคเกนส์) ซึ่งค่อนข้างมีราคาไม่แพง
เครื่องมือนี้อาจมีเจตนาดีที่สุด แต่ไม่ต้องสงสัยเลยว่าเครื่องมือนี้จะถูกนำไปใช้ในทางที่ผิดเพื่อจุดประสงค์ที่เป็นอันตราย การโคลนเสียงโดยปัญญาประดิษฐ์ได้พิสูจน์ถึงอันตรายแล้ว โดยเฉพาะอย่างยิ่งกับการโทรอัตโนมัติจริงจาก Joe Biden ปลอม นี่คือเหตุผลที่ OpenAI ต้องใช้ความระมัดระวัง
ลีร์การโทรปลอมหลายพันสายจาก Joe Biden โดยใช้ AI จะมีราคาเพียง 500 ดอลลาร์เท่านั้น
OpenAI ตระหนักดีว่าการลงคะแนนเสียงแบบโคลนก่อให้เกิดความเสี่ยงร้ายแรง โดยเฉพาะอย่างยิ่งในช่วงปีการเลือกตั้งที่วุ่นวาย นี่คือเหตุผลที่บริษัท”ร่วมมือกับพันธมิตรในรัฐบาลสหรัฐฯ และรัฐบาลระหว่างประเทศ สื่อ บันเทิง การศึกษา ภาคประชาสังคม และอื่นๆ» เพื่อบูรณาการข้อเสนอแนะระหว่างกระบวนการพัฒนา
ในด้านหนึ่ง พันธมิตรที่สามารถเข้าถึง Voice Engine ได้ปฏิบัติตามข้อกำหนดการใช้งานของ OpenAI ซึ่งห้ามการโจรกรรมข้อมูลประจำตัวหรือการหาประโยชน์จากเสียงโดยไม่ได้รับความยินยอมจากบุคคลนั้น พันธมิตรเหล่านี้จะต้องประกาศสีและระบุอย่างชัดเจนว่าเสียงนั้นถูกสร้างขึ้นโดยปัญญาประดิษฐ์
ในทางกลับกันก็มีการพัฒนามาตรการรักษาความปลอดภัย เช่น ลายน้ำเพื่อติดตามที่มาของเสียงและ”การตรวจสอบการใช้งานเชิงรุก- แต่ก็ยากที่จะมั่นใจได้เต็มที่… OpenAI ระบุว่าเทคโนโลยีนี้ใช้ไม่ได้กับทุกคน”สำหรับตอนนี้-
โดยการเปิดเผยภาพรวมนี้ บริษัทหวังที่จะกระตุ้นให้เกิดการอภิปรายเกี่ยวกับนโยบายที่มุ่งเป้าไปที่ "ปกป้องการใช้เสียงของผู้คนของ AI» และ «ให้ความรู้แก่สาธารณชนในการทำความเข้าใจความสามารถและข้อจำกัดของเทคโนโลยี AI- รอสลิปแรกเหรอ?
🔴 เพื่อไม่ให้พลาดข่าวสารจาก 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-
Opera One - เว็บเบราว์เซอร์ที่ขับเคลื่อนด้วย AI
โดย: โอเปร่า
แหล่งที่มา : OpenAI