นักวิจัยของ Google ได้พัฒนาไฟล์(AI) ระบบคณิตศาสตร์ที่สามารถมองหาผู้ชนะเลิศเหรียญทองในการแข่งขันเรขาคณิตระหว่างประเทศ
ระบบที่เรียกว่า "Alphageometry2" (AG2) เป็นเฟรมเวิร์ก AI ขั้นสูงที่สามารถแก้ปัญหาเรขาคณิต 84% ที่เกิดขึ้นใน Olympiad ทางคณิตศาสตร์ระหว่างประเทศ (IMO) ผู้ชนะเหรียญทอง IMO เฉลี่ยแก้ไขปัญหา 81.8% ของปัญหาโอลิมปิก
ออกแบบโดยมันสามารถมีส่วนร่วมไม่เพียง แต่ในการจับคู่รูปแบบ แต่ยังรวมถึงการแก้ปัญหาอย่างสร้างสรรค์นักวิทยาศาสตร์กล่าว พวกเขาสรุปผลการวิจัยของพวกเขาในการศึกษาที่อัปโหลดเมื่อวันที่ 7 กุมภาพันธ์ไปยัง preprintarxivฐานข้อมูล
การประกาศของ บริษัท มาหนึ่งเดือนหลังจาก Microsoft เปิดตัวระบบการให้เหตุผลทางคณิตศาสตร์ AI ขั้นสูงของตนเองrstar-mathซึ่งใช้แบบจำลองภาษาขนาดเล็ก (SML) เพื่อแก้สมการที่ซับซ้อน ทั้งสอง บริษัท พยายามที่จะครองโดเมนคณิตศาสตร์ AI เพราะนักวิทยาศาสตร์กล่าวว่าระบบที่มีความสามารถสูงในการแก้ปัญหาทางคณิตศาสตร์อาจเลียนแบบรูปแบบอื่น ๆ ได้อย่างเพียงพอ- Ag2 แตกต่างจาก rstar-math ของ Microsoft โดยมุ่งเน้นไปที่การแก้ปัญหาขั้นสูงด้วยรูปแบบการให้เหตุผลแบบไฮบริดในขณะที่ R-Star ใช้แบบจำลองภาษาขนาดเล็กเพื่อแก้ปัญหาที่กว้างขึ้น
Google เปิดตัวไฟล์ตัวอักษรเวอร์ชันดั้งเดิมในเดือนมกราคม 2567 และเวอร์ชันล่าสุดแสดงประสิทธิภาพเพิ่มขึ้น 30% จากการทำซ้ำก่อนหน้านี้นักวิทยาศาสตร์กล่าวในการศึกษา การปรับปรุงใน Ag2 มุ่งเน้นไปที่การเรียนรู้ของเรขาคณิตซึ่งแตกต่างจากแคลคูลัสและพีชคณิตต้องใช้การผสมผสานของการใช้เหตุผลและตรรกะเพื่อแก้ปัญหาที่ซับซ้อน
ที่เกี่ยวข้อง:
อย่างไรก็ตามผู้เชี่ยวชาญเตือนไม่ให้ดูเหตุการณ์สำคัญนี้เป็นการบรรลุเป้าหมาย(AGI) - ที่ระบบ AI นั้นฉลาดกว่ามนุษย์ในหลายสาขาแทนที่จะเป็นเพียงมนุษย์ในด้านเดียวโดยไม่คำนึงถึงข้อมูลการฝึกอบรม
"Alphageometry2 หมายถึงรูปแบบของความฉลาด แต่ความฉลาดของมนุษย์ไปไกลกว่านี้ - เราคิดค้นขึ้นมาแทนที่จะใช้ความรู้หรือสร้างภาพลวงตาของความคิด"John Batesซีอีโอของ AI Company Ser Group และแพทย์สาขาวิทยาศาสตร์คอมพิวเตอร์จากมหาวิทยาลัยเคมบริดจ์บอกกับวิทยาศาสตร์การใช้ชีวิต
AI สามารถแก้ปัญหาคณิตศาสตร์ที่ยากที่สุดได้อย่างไร
ความก้าวหน้าของ DeepMind คือการผสมผสานที่ประสบความสำเร็จและเครื่องยนต์สัญลักษณ์ (ระบบอิงตามตรรกะที่ออกแบบมาเพื่อแก้ปัญหาโดยใช้สัญลักษณ์และพารามิเตอร์) แบบจำลองภาษาแนะนำการสร้างทางเรขาคณิตในขณะที่เครื่องยนต์สัญลักษณ์ทดสอบ การจับคู่นี้ช่วยให้ระบบสามารถแปลงภาษาในชีวิตประจำวันที่มนุษย์จะเห็นในปัญหาเรขาคณิตและแปลงเป็น "การก่อสร้างเสริม" ที่เครื่องยนต์สัญลักษณ์สามารถเข้าใจและทดสอบได้
ระบบจะทำงานร่วมกันเพื่อเสนอสิ่งปลูกสร้างใหม่หากก่อนหน้านี้ไม่ทำงาน การค้นหาวิธีแก้ปัญหานี้จะทำแบบคู่ขนานผ่านข้อมูลจากด้านหนึ่งของระบบไปยังอีกด้านหนึ่งจนกว่าจะมาถึงโซลูชัน
AG2 ดีกว่ารุ่นแรกด้วยรูปแบบภาษาประสาทที่ผ่านการฝึกอบรมเกี่ยวกับชุดข้อมูลที่มีขนาดใหญ่และหลากหลายมากขึ้นควบคู่ไปกับเครื่องยนต์สัญลักษณ์ที่เร็วกว่าเพื่อตรวจสอบการก่อสร้างทางเรขาคณิตมากขึ้น ระบบยังมีอัลกอริทึมที่เป็นเอกลักษณ์สำหรับการค้นหาและค้นหาหลักฐานทางเรขาคณิต
นักวิจัย DeepMind ตั้งข้อสังเกตว่าข้อเสียของ AG2 อยู่ในเวลาประมวลผลที่ยาวนานขึ้นและไม่สามารถจัดการกับปัญหาเรขาคณิตของ IMO ที่ท้าทายที่สุดในเรขาคณิต 3 มิติสมการที่ไม่ใช่เชิงเส้นหรือปัญหาที่มีจุดแปรผัน ในที่สุดระบบไม่สามารถอธิบายได้ว่ามันมาถึงวิธีแก้ปัญหาในภาษาใดก็ได้ที่มนุษย์สามารถเข้าใจได้
ขอบเขตของแรงบันดาลใจของ DeepMind สำหรับระบบ AG2 ยังคงอยู่ในการปรับปรุงอย่างเต็มที่- แต่การปรับปรุงในพื้นที่นี้สามารถนำไปใช้กับหลายสาขารวมถึงการออกแบบทางวิศวกรรมการตรวจสอบระบบอัตโนมัติหุ่นยนต์การวิจัยทางเภสัชกรรมและการวิจัยจีโนมนักวิทยาศาสตร์กล่าว
แผนนี้มีไว้สำหรับ AG2 ที่จะส่งมอบระบบอัตโนมัติเต็มรูปแบบของการแก้ปัญหาเรขาคณิตนักวิทยาศาสตร์กล่าวเสริมโดยไม่มีข้อผิดพลาดใด ๆ ในรุ่นอนาคตพวกเขาหวังว่าจะขยายการสนับสนุนแนวคิดทางเรขาคณิตมากขึ้นและแบ่งปัญหาออกเป็นกลุ่มย่อย พวกเขายังวางแผนที่จะเร่งกระบวนการอนุมานและความน่าเชื่อถือของระบบ