Meta เพิ่งยกม่านบน VoiceBox ซึ่งเป็นปัญญาประดิษฐ์ที่สามารถเลียนแบบเสียงของมนุษย์ได้ ด้วยการพึ่งพาระเบียนหลายพันชั่วโมงรุ่นนี้สามารถแปลงข้อความเป็นไฟล์เสียงได้ ตระหนักถึงความเสี่ยง Meta ได้ใช้ความระมัดระวังเพื่อหลีกเลี่ยงการลอย ...
Meta ยังคงเป็นสถานที่ที่เลือกในโลกแห่งปัญญาประดิษฐ์ ยักษ์ Menlo Park ได้วางออนไลน์Kyrielle ของโมเดล AIในช่วงไม่กี่เดือนที่ผ่านมาเริ่มต้นด้วยLlama เทโมเดลภาษาขนาดใหญ่เมตา AI- มีให้สำหรับนักพัฒนารุ่นนี้ทำให้สามารถออกแบบฝูงชนของแชทบอทส่วนบุคคลได้ซึ่งFreedomGpt หุ่นยนต์สนทนาที่ไม่เปลี่ยนแปลง-
AI ของ Meta สามารถเลียนแบบเสียงของคุณได้อย่างไร
อีกไม่นาน Meta ยังเปิดตัว "Jepa" ซึ่งเป็นรุ่นที่แตกต่างกันมากต้องการอยู่ใกล้กับความฉลาดของมนุษย์, ETเพลงAI ที่สร้างเพลงตามคำอธิบาย ในขณะนี้ บริษัท ของ Mark Zuckerberg นำเสนอกล่องเสียง- AI กำเนิดนี้ออกแบบมาเพื่อสร้างไฟล์เสียง เห็นได้ชัดว่า AI สามารถ "ออกเสียง" คำพูดและทำให้มีอยู่ในไฟล์เสียง
ระบบนี้"สรุปเสียงร้อง"ความต้องการ"ตัวอย่างเสียงยาวนานสองวินาที"เพื่อใช้งาน แรงบันดาลใจจากตัวอย่างนี้ AI จะสร้างคำพูดเหมือนคนที่ได้ยินในสารสกัด ตามที่อธิบายโดย บริษัท แม่ของFacebookในรายงานของเขา"VoiceBox ถูกสร้างขึ้นเพื่อทำนายเซ็กเมนต์การพูดเมื่อได้รับการพูดโดยรอบและการถอดความ"
อย่างเป็นรูปธรรมคุณสามารถจำลองเสียงของคนที่คุณรักหรือนักร้องเท่านั้นที่มีไฟล์เสียงสั้น ๆ เป็นตัวอย่าง AI ยังใช้บริบทของข้อความเพื่อปรับเทียบการผลิต ในทำนองเดียวกันรูปแบบเสียงสามารถนำไปใช้กับวาทกรรมที่มีอยู่แล้ว AI สามารถแทนที่เสียงเริ่มต้นด้วยของบุคคลอื่น
"VoiceBox สามารถสร้างคำที่เป็นตัวแทนมากขึ้นเกี่ยวกับวิธีที่ผู้คนพูดในโลกแห่งความเป็นจริง"อธิบายเมตา
อ่านเพิ่มเติม:False Chatgpt บุกรุกอินเทอร์เน็ต - คำเตือนของ Meta
ความเป็นไปได้ที่ไม่มีที่สิ้นสุด
ในการแถลงข่าว Meta ระบุว่า AI สามารถทำได้อำนวยความสะดวกในการแก้ไขไฟล์เสียง- ตัวอย่างเช่น VoiceBox มีความสามารถในการลบแตรรถหรือสุนัขเห่าในพื้นหลัง หากเสียงรบกวนความสามัคคีของไฟล์ AI สามารถลบส่วนที่มีปัญหาและสร้างใหม่จาก A ถึง Z ในทำนองเดียวกันความล้มเหลวของการออกเสียงหรือคำที่เลือกไม่ดีสามารถลบได้ง่ายในการโพสต์โดย AI
ไอซิ่งบนเค้กโมเดล VoiceBox นั้นพูดได้หลายภาษา เขาสนับสนุนหกภาษาที่แตกต่างกันคือภาษาอังกฤษ, ฝรั่งเศส, สเปน, เยอรมัน, โปแลนด์และโปรตุเกส จากข้อมูลของ META AI กำเนิดสามารถอำนวยความสะดวกในการแลกเปลี่ยนระหว่างบุคคลที่ไม่ได้พูดภาษาเดียวกัน อันที่จริงโมเดลสามารถสร้างวาทกรรมในภาษาอื่นนอกเหนือจากไฟล์เสียงเริ่มต้น ข้อความที่บันทึกเป็นภาษาอังกฤษสามารถก่อให้เกิดไฟล์เสียงเป็นภาษาสเปนหรือฝรั่งเศสได้เป็นอย่างดี ตามที่นักออกแบบ VoiceBox ยังสามารถส่งเสียงให้กับคนที่เงียบหรือปรับแต่งตราประทับของผู้ช่วยเสมือนจริงหรือตัวละครที่ไม่สามารถเล่นได้ในเกม
ไม่น่าแปลกใจที่โมเดลขึ้นอยู่กับภูเขาข้อมูลเพื่อปฏิบัติงานที่ได้รับมอบหมาย Meta อธิบายว่ามันมีการรดน้ำแบบจำลองทั้งหมดด้วยการกล่าวสุนทรพจน์และหนังสือเสียงที่บันทึกไว้ฟรีการเข้าถึงฟรีเขียนในภาษาที่แตกต่างกัน โดยรวมแล้วเสียงมากกว่า 50,000 ชั่วโมงถูกกลืนโดยแบบจำลองในระหว่างขั้นตอนการฝึกอบรม
โดยละเอียดโมเดลถูกวาดบนพื้นฐานของเทคนิคที่เรียกว่า SOการจับคู่การไหลคิดค้นโดยนักวิจัยเมตา ช่วยให้ AI สามารถเรียนรู้ได้โดยใช้ข้อมูลที่นักวิจัยไม่ได้ติดป้ายอย่างรอบคอบซึ่งแสดงถึงการประหยัดเวลา
แม้จะมีข้อได้เปรียบมากมาย แต่ VoiceBox ยังคงทนทุกข์ทรมานจากข้อ จำกัด บางประการ โดยพื้นฐานแล้วได้รับการฝึกฝนเกี่ยวกับหนังสือเสียงโมเดลนั้นไม่ได้มีประสิทธิภาพในการสร้างการสนทนาที่เรียบง่ายบ่อยครั้งซึ่งมักจะสลับกับการแสดงออกที่เกิดขึ้นเองและไม่ใช่คำพูด ในทำนองเดียวกันรูปแบบของเสียงน้ำเสียงบางครั้งอารมณ์ยังคงยากที่จะเข้าใจอัลกอริทึม
ซอร์สโค้ดที่ไม่สามารถเข้าถึงได้
Meta จะไม่สามารถเข้าถึงซอร์สโค้ดของ AI ได้ในขณะนี้ แม้ว่าจะเป็น"สำคัญที่จะเปิดให้กับชุมชนและแบ่งปันงานวิจัยของเรา"ยักษ์ Menlo Park ชี้ไปที่สำคัญ"เมเปิ้ลใช้ศักยภาพและความเสียหายโดยไม่สมัครใจ"- ไม่น่าแปลกใจที่เมตากลัวว่า AI เคยใช้การใช้เอกลักษณ์บุคคลหรือสร้างเพลงเช่นศิลปิน
ในแบบคู่ขนานเมตาจึงพัฒนาเครื่องมือที่สามารถกำหนดได้ว่าเสียงถูกสร้างขึ้นโดยปัญญาประดิษฐ์หรือเป็นสารสกัดจริงหรือไม่ ความคิดริเริ่มนี้เตือนเล็กน้อยเครื่องตรวจจับที่พัฒนาโดย openaiเพื่อระบุเนื้อหาที่จินตนาการโดยCHATGPT-
โปรดทราบว่านี่ไม่ใช่โมเดล AI ตัวแรกที่สามารถสร้างวาทกรรมเสียงบนพื้นฐานของตัวอย่างเสียง นี่เป็นกรณีที่มีVall-E แบบจำลองที่พัฒนาโดย Microsoft- ด้วยตัวอย่างเพียงสามวินาทีเครื่องมือสามารถทำได้เลียนแบบเสียงที่ไม่มีที่สิ้นสุด- ใน Mirffebox Mirror, Vall-E แตกต่างจากเครื่องกำเนิดไฟฟ้าที่มีอยู่แล้วเช่นการพูดหรือเสียงสำคัญของ Elevenlab โดยจำนวนข้อมูลที่ลดลงที่จำเป็นสำหรับการออกแบบไฟล์เสียง ด้วยตัวอย่างที่สั้นมากตอนนี้เป็นไปได้ที่จะเลียนแบบเสียงของบุคคล ...
🔴อย่าพลาดข่าว 01NET ใด ๆ ติดตามเราที่Google NewsETWhatsapp-
Opera One - เว็บเบราว์เซอร์ที่เพิ่มขึ้นที่ AI
โดย: โอเปร่า
แหล่งที่มา : เมตา