Meta เข้าสู่ Midjourney ด้วย AI ที่สร้างภาพที่ปฏิวัติวงการ

Meta อ้างว่าได้พัฒนา AI ที่สร้างภาพที่ซับซ้อนที่สุดในโลก แม้ว่าจะใช้พลังการประมวลผลน้อยลง โมเดล AI นี้มีเป้าหมายที่จะมีประสิทธิภาพมากกว่าโซลูชันของคู่แข่ง เช่น Midjourney หรือ Dall-E

เมต้าเพิ่งเปิดม่านขึ้นCM3Leonซึ่งเป็นโมเดล AI ใหม่ สะท้อนการเดินทางกลางทาง,อะโดบี หิ่งห้อย, การแพร่กระจายที่เสถียรหรือดัล-อีโมเดลสามารถสร้างรูปภาพจากข้อความสั้นได้

ตามข้อมูลของ Meta การสร้างมันมีประสิทธิภาพมากกว่าโซลูชันของคู่แข่งในขณะที่ต้องการพลังการประมวลผลน้อยกว่า แม้จะมีพลังการประมวลผลที่จำกัด แต่ CM3Leon ก็ได้รับประโยชน์จากพารามิเตอร์ทั้งหมด 7 พันล้านพารามิเตอร์ ซึ่งมากกว่า Dall-E ซึ่งเป็นตัวสร้าง OpenAI ถึงสองเท่า

“ด้วยความสามารถของ CM3Leon เครื่องมือสร้างภาพสามารถสร้างภาพที่สอดคล้องกันมากขึ้นซึ่งตรงกับการค้นหามากขึ้น”Meta กล่าวเพื่อให้แน่ใจว่า AI ต้องการพลังการประมวลผลน้อยกว่าคู่แข่งถึงห้าเท่า

อ่านเพิ่มเติม:Google DeepMind สัญญาว่าจะบดขยี้ ChatGPT ด้วยโมเดล AI ที่ทันสมัยที่สุดในโลก

Meta อ้างว่ามีการปฏิวัติเครื่องกำเนิดภาพ

ในการออกแบบ AI นักวิจัย Meta เลือกใช้แนวทางที่แตกต่างบริษัทอื่นๆ ที่มีส่วนร่วมในการแข่งขันด้านปัญญาประดิษฐ์ เครื่องมืออย่าง Dall-E หรือ Stable Diffusion อาศัยกระบวนการที่เรียกว่า "diffusion" เพื่อสร้างภาพ กระบวนการนี้ประกอบด้วยการค่อยๆ ลบองค์ประกอบต่างๆ จนกระทั่งได้ภาพที่ใกล้เคียงกับคำถามของผู้ใช้

น่าเสียดายที่แนวทางนี้ต้องใช้พลังในการประมวลผลเป็นจำนวนมาก เพื่อให้สิ่งนี้จำเป็นอย่างยิ่งที่จะต้องขับเคลื่อน AI ด้วยคอมพิวเตอร์ที่ทรงพลังซึ่งใช้พลังงานไฟฟ้า นอกจากนี้กระบวนการนี้ค่อนข้างช้า ไม่สามารถสร้างภาพต่อเนื่องแบบเรียลไทม์ได้

นี่คือเหตุผลที่เมตาหันมาหากลไกการสร้างภาพอีกแบบหนึ่ง, เรียกว่า"ความสนใจ"- AI จะประเมินความเกี่ยวข้องของข้อมูลที่สื่อสาร ซึ่งช่วยประหยัดเวลาและพลังงานได้มากในการสร้างภาพ กระบวนการนี้ยังรวมถึงขั้นตอนที่เรียกว่าขั้นตอนการปรับเปลี่ยนด้วย ในระหว่างขั้นตอนนี้ ความเข้าใจในคำแนะนำจะได้รับการปรับปรุง

CM3Leon ยังโดดเด่นจากโปรแกรมสร้างรูปภาพอื่นๆ ด้วยฟังก์ชั่นที่สอง- AI ยังสามารถบรรยายภาพได้อีกด้วย หากคุณให้รูปถ่ายแก่โมเดล พวกเขาจะสามารถระบุรายละเอียดได้ว่าโมเดลนั้นแสดงถึงอะไร เช่นเดียวกับ GPT-4 หรือ PaLM 2 CM3Leon ก็เป็น AI ต่อเนื่องหลายรูปแบบ สามารถประมวลผลแหล่งข้อมูลได้หลายแหล่ง เช่น ข้อความและรูปภาพ

ภาพที่ไม่มีค่าลิขสิทธิ์

Meta ยังระบุว่า CM3Leon ต้องการข้อมูลการฝึกอบรมน้อยลงเพื่อให้สามารถทำงานได้ เพื่อหลีกเลี่ยงปัญหาที่อาจเกิดขึ้น ยักษ์ใหญ่แห่งแคลิฟอร์เนียจึงฝึกฝน AI โดยเฉพาะด้วยภาพปลอดค่าลิขสิทธิ์ที่มีอยู่ใน Shutterstock ข้อควรระวังนี้ช่วยให้“หลีกเลี่ยงปัญหาที่เกี่ยวข้องกับการเป็นเจ้าของรูปภาพและการระบุแหล่งที่มา โดยไม่สูญเสียประสิทธิภาพ”เมตาอธิบาย

Adobe อาศัยวิธีการที่คล้ายกันโดยการพัฒนา Firefly ซึ่งเป็น AI กำเนิดของโฟโต้ชอป- บริษัทซอฟต์แวร์ใช้เฉพาะรูปภาพจากฐานข้อมูล Adobe Stock รูปภาพปลอดค่าลิขสิทธิ์ และรูปภาพลิขสิทธิ์อิสระ เพื่อฝึกฝนโมเดล AI

Meta ไม่ใช่ความพยายามครั้งแรกของเขา ในช่วงหลายเดือนที่ผ่านมา กลุ่ม Menlo Park ได้เปิดตัวโมเดล AI หลายแบบสำหรับโลกแห่งการวิจัย Meta ได้เปิดให้ใช้งานได้อย่างโดดเด่นกล่องเสียงปัญญาประดิษฐ์ที่สามารถเลียนแบบเสียงของมนุษย์หรือแม้แต่มิวสิคเจนซึ่งเป็นเครื่องมือที่สามารถผลิตเพลงตามความต้องการได้

ขณะเดียวกันบริษัทของ Mark Zuckerberg ก็เผยว่าLLaMA สำหรับโมเดลภาษาขนาดใหญ่ Meta AIซึ่งเป็นโมเดลโอเพ่นซอร์สที่นำเสนอทางเลือกแทน GPT บริษัทยังตั้งเป้าหมายที่จะนำเสนอโมเดล AI ที่เรียนรู้ได้เพียงเล็กน้อยเหมือนสติปัญญาของมนุษย์- ในขณะนี้ Meta ยังไม่ได้ระบุว่า CM3Leon จะพร้อมให้บริการแก่ผู้ใช้เมื่อใด

🔴 เพื่อไม่พลาดข่าวสาร 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-

แหล่งที่มา : เมตา

Meta อ้างว่ามีการปฏิวัติเครื่องกำเนิดภาพ

ภาพที่ไม่มีค่าลิขสิทธิ์

相關貼文