โมเดลภาษา Meta รุ่นที่สองสำหรับปัญญาประดิษฐ์มาถึงเพียงห้าเดือนหลังจากครั้งแรก นี่เป็นบริการฟรีและโอเพ่นซอร์ส แต่ตอนนี้บริษัทแม่ของ Facebook กำลังพัฒนาโดยร่วมมือกับ Microsoft Google และ LaMDA ควรระวังให้ดีกว่านี้
ต่างจาก Google หรือ OpenAI ตรงที่กลุ่ม Meta ยังไม่มีเครื่องมือสนทนาสาธารณะทั่วไปของตัวเอง ซึ่งเสริมประสิทธิภาพด้วยปัญญาประดิษฐ์และเป็นที่รู้จักของทุกคน แต่ตั้งแต่เดือนกุมภาพันธ์เขามีภาษาสนทนา กล่าวอีกนัยหนึ่ง เอ็นจิ้นเดียวกับที่ช่วยให้คุณพัฒนาเครื่องมือตั้งแต่การสร้างข้อความไปจนถึงการสร้างไดนามิก รวมถึงโปรแกรมที่ซับซ้อนมากขึ้น ความละเอียดทางคณิตศาสตร์ โค้ด เครื่องมือสำหรับการวิจัยทางวิทยาศาสตร์ และอีกมากมาย
LLaMA 2 เพิ่งประกาศผ่านการแถลงข่าวเมื่อวันที่ 18 กรกฎาคม และถือเป็นรุ่นที่สองของโมเดลภาษาศาสตร์แล้ว ตรงกันข้ามกับข่าวลือไฟแนนเชียลไทมส์ในช่วงไม่กี่ชั่วโมงที่ผ่านมา Meta ยังไม่ได้จ่ายเงินเพื่อเข้าถึงโมเดลของมัน ซึ่งเป็นแม้แต่โอเพ่นซอร์ส ซึ่งนักวิจัยและบริษัทต่างๆ สามารถเข้าถึงได้ (เพื่อวัตถุประสงค์ทางการค้า)“เรารวมน้ำหนักโมเดลและซอร์สโค้ดสำหรับโมเดลที่ได้รับการฝึกอบรมล่วงหน้าและเวอร์ชันที่ได้รับการปรับแต่งอย่างละเอียด”เราก็อ่านได้ ทำความเข้าใจโดย“เวอร์ชันที่ได้รับการปรับแต่ง”โปรแกรมทั้งหมดที่จะใช้โมเดลภาษาสำหรับการใช้งานและข้อมูลเฉพาะ
การประกาศเผยแพร่ LLaMA 2 ทั้งหมดเกิดขึ้นเพียงหนึ่งสัปดาห์หลังจากการปรับใช้ในระดับที่ใหญ่ขึ้น (โดยเฉพาะในฝรั่งเศส) ของBard เจ้าหน้าที่สนทนาของ Googleน่าจะลงแข่งChatGPT- ผลลัพธ์ที่น่าประหลาดใจคือสองเท่า: Meta เลือกใช้โมเดลโอเพ่นซอร์ส ซึ่งเป็นสิ่งที่ Google และ OpenAI ต้องการให้เก็บไว้สำหรับโมเดลที่เป็นความลับมากกว่า“ผมคิดว่ามันจะปลดล็อกความก้าวหน้าได้มากขึ้นหากระบบนิเวศเปิดกว้างมากขึ้น ซึ่งเป็นเหตุผลว่าทำไมเราถึงสร้าง Llama 2 โอเพ่นซอร์ส”, เขียน Mark Zuckerberg ในโพสต์บน Facebook ผลกระทบที่น่าประหลาดใจครั้งที่สองและการมาถึงในฐานะพันธมิตรพิเศษของ Microsoft ในโครงการ ดังนั้นยักษ์ใหญ่ด้านดิจิทัลจึงทำงานร่วมกับทั้ง OpenAI และ Meta และแยก Google ออกไปอีก
Microsoft พันธมิตรที่ได้รับสิทธิพิเศษ
ดูเหมือนว่า Meta จะเน้นไปที่การใช้งานเพื่อจุดประสงค์ทางวิชาชีพมากกว่า (ChatGPT กำลังพัฒนาเวอร์ชันที่เหมาะกับมืออาชีพเช่นกัน) และสิ่งนี้ทำให้ Microsoft พอใจซึ่งร่วมมือกันเพื่อเป็น "พันธมิตรที่ต้องการ" ดังนั้นจึงไม่มีการทำการตลาดของ LLaMA แต่เป็นการเข้าถึงลูกค้า Microsoft Azure และแคตตาล็อกโมเดล AI ใหม่ ในทำนองเดียวกัน“LLaMA จะได้รับการปรับให้ทำงานบน Windows ได้อย่างเหมาะสม นักพัฒนา Windows จะสามารถใช้ Llama ได้โดยกำหนดเป้าหมายผู้ให้บริการรันไทม์ DirectML ผ่าน ONNX Runtime »ระบุ Microsoft ในข่าวประชาสัมพันธ์แยกต่างหาก
ทั้งสองบริษัทได้ร่วมมือกันแล้วในการเปิดตัวเฟรมเวิร์ก PyTorch ซึ่งตั้งแต่ปี 2559 ได้เป็นหนึ่งในเฟรมเวิร์กหลักที่ใช้ในการฝึกอบรมโครงข่ายประสาทเทียมสำหรับ AI และการเรียนรู้เชิงลึก จากนั้น ทั้งสองก็ผนึกกำลังกันก่อตั้งมูลนิธิ PyTorch ซึ่งเปิดตัวในเดือนกันยายน 2565 และปัจจุบันเป็นผู้ดูแลกรอบการทำงาน หลังจาก Microsoft ลูกค้าของ Amazon Web Services (AWS) และ Hugging Face จะสามารถเข้าถึง LLaMA 2 ได้เช่นกัน
ลามา 2 กับ ลามา 1
หากข่าวประชาสัมพันธ์ไม่ได้เน้นถึงความแตกต่างระหว่าง LLaMA 1 และ LLaMA 2 จริงๆ ก็ค่อนข้างจะแตกต่างจากอินเทอร์เน็ตเว็บไซต์ของแบบจำลองทางภาษา ดังนั้นเราจึงเรียนรู้ว่ารุ่นที่สองได้รับการฝึกฝนบนฐานข้อมูลที่มีขนาดใหญ่กว่ารุ่นแรกถึง 40% เพื่อความเข้าใจที่ดีขึ้น การคาดการณ์ที่ดีขึ้น และการสร้างข้อความที่ปรับเปลี่ยนได้มากขึ้น Meta แจ้งว่า LLaMA 2 ได้เพิ่มเป็นสองเท่า« ความยาวบริบท », ความยาวบริบท เป็นองค์ประกอบที่กำหนดประสิทธิภาพของผลลัพธ์ แต่สำหรับโมเดลภาษา ยังเป็นองค์ประกอบที่ทำให้การทำงานช้าลงด้วย
![](https://webbedxp.com/th/tech/misha/app/uploads/2023/07/benchmarks-llama-2-meta.jpg)
ในส่วนของความเร็ว Meta ได้เผยแพร่ผลลัพธ์ของการวัดประสิทธิภาพหลายรายการ โดยเปรียบเทียบกับผลลัพธ์ของคู่แข่งบางราย (ไม่ได้อ้างถึง Google และ OpenAI) รวมถึง LLaMA 1 เวอร์ชันต่างๆ บนกราฟ MPT หมายถึงการเปิด แบบจำลองภาษาต้นฉบับของ MosaicML และ Falcon ไปจนถึงแบบจำลองภาษาโอเพ่นซอร์สของสถาบันนวัตกรรมเทคโนโลยีอาบูดาบี ซึ่งมาถึงเมื่อเดือนมิถุนายนปีที่แล้ว และสร้างความประหลาดใจอย่างยิ่งกับประสิทธิภาพการทำงาน จากข้อมูลของ Meta โมเดลที่ดีที่สุดที่พารามิเตอร์ 70B จะดีกว่า Falcon ที่พารามิเตอร์ 40B
ตั้งแต่เดือนกุมภาพันธ์จนถึงปัจจุบัน Meta กล่าวว่าได้รับคำขอเข้าถึงโมเดล LLaMA 1 จำนวน 100,000 คำขอ ด้วยการบูรณาการชั้นนำและการเชื่อมโยงกับ Microsoft การใช้ LLaMA 2 อาจแข็งแกร่งขึ้นได้ เว้นแต่จะมีการแข่งขันเช่น Falcon หรือโมเดลจาก Google และ OpenAI เกิน. การแข่งขันจะยังคงเหมือนเดิม: การนำเสนอโมเดลขั้นสูงยิ่งขึ้น ขั้นสูงยิ่งขึ้นสำหรับการใช้งานเฉพาะในเวอร์ชัน "ที่ได้รับการปรับแต่ง" แต่ยังเบากว่าเดิม เพื่อให้สามารถรวมเข้ากับเครื่องจักรที่เข้าถึงได้มากขึ้น รวมถึงในแวดวงวิชาการและธุรกิจ
🔴 เพื่อไม่พลาดข่าวสาร 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-