หาทางสำหรับหุ่นยนต์
ระบบปัญญาประดิษฐ์ได้เอาชนะผู้เล่นมืออาชีพ GO โดยทำลายหนึ่งในความท้าทายอันยิ่งใหญ่ที่ยาวนานในสนาม ยิ่งไปกว่านั้นระบบใหม่ที่เรียกว่าอัลฟาโกเอาชนะผู้เล่นมนุษย์โดยการเรียนรู้เกมตั้งแต่เริ่มต้นโดยใช้วิธีการที่เรียกว่า "การเรียนรู้ลึก" นักวิจัยที่เกี่ยวข้องกล่าว
ความพ่ายแพ้ที่น่าทึ่งแสดงให้เห็นว่าสิ่งใหม่ปัญญาประดิษฐ์(AI) กลยุทธ์การเรียนรู้อาจเป็นเครื่องมือที่ทรงพลังในเวทีอื่น ๆ เช่นการวิเคราะห์รีมของข้อมูลสภาพภูมิอากาศโดยไม่มีโครงสร้างที่ชัดเจนหรือทำการวินิจฉัยทางการแพทย์ที่ซับซ้อนนักวิทยาศาสตร์กล่าว
นักวิจัยรายงานเกี่ยวกับ Matchup ใหม่ออนไลน์วันนี้ (27 มกราคม) ในวารสารธรรมชาติ- -เครื่องจักรสุดพิเศษ: 7 Robotic Futures-
ผู้ชายกับเครื่องจักร
นับตั้งแต่ IBM'sสีน้ำเงินเข้มพ่ายแพ้ Gary Kasparovในการแข่งขันหมากรุกที่เป็นสัญลักษณ์ของพวกเขาในปี 1997 นักวิจัย AI ได้สร้างหุ่นยนต์อย่างเงียบ ๆ ซึ่งสามารถเชี่ยวชาญงานอดิเรกของมนุษย์ได้มากขึ้นเรื่อย ๆ ในปี 2014 วัตสันของไอบีเอ็มเอาชนะอันตราย! แชมป์เคนเจนนิงส์และเมื่อปีที่แล้วคอมพิวเตอร์ชื่อ Claudico-ที่สามารถ "bluff" ผ่านหัวไม่ จำกัด Texas Hold 'Em-ให้มนุษย์ผู้เล่นโป๊กเกอร์การวิ่งเพื่อเงินของพวกเขาที่คาสิโนพิตต์สเบิร์ก
อย่างไรก็ตามไปเป็นน็อตที่ยากกว่ามากที่จะแตก ที่เกมกลยุทธ์ซึ่งมีต้นกำเนิดในจีนประมาณ 2,500 ปีที่ผ่านมาอาศัยกฎง่ายๆที่หลอกลวง ผู้เล่นวางหินสีขาวและสีดำบนกระดานขนาดใหญ่เพื่อล้อมรอบดินแดนส่วนใหญ่ หินที่มีสีเดียวที่สามารถสัมผัสหินที่เป็นมิตรอื่น ๆ ได้รับการกล่าวขานว่ามีชีวิตอยู่ในขณะที่ผู้ที่มีเส้นทางหลบหนีถูกตัดออกไป
แต่เบื้องหลังกฎง่ายๆคือเกมที่มีความซับซ้อนอย่างไม่น่าเชื่อ ผู้เล่นที่ดีที่สุดใช้เวลาตลอดชีวิตเพื่อฝึกฝนเกมเรียนรู้ที่จะรับรู้ลำดับการเคลื่อนไหวเช่น "บันได" กลยุทธ์การคิดค้นเพื่อหลีกเลี่ยงการต่อสู้ที่ไม่มีที่สิ้นสุดสำหรับดินแดนที่เรียกว่า "Ko Wars" และพัฒนาความสามารถที่น่าประหลาดใจในการดูบอร์ด Go
“ มันอาจเป็นเกมที่ซับซ้อนที่สุดที่มนุษย์คิดค้นขึ้นมา” Demis Hassabis ผู้เขียนร่วมการศึกษานักวิทยาศาสตร์คอมพิวเตอร์ที่ Google Deepmind ในลอนดอนกล่าวเมื่อวานนี้ (26 มกราคม) ในการแถลงข่าว "มันมี 10 ถึงตำแหน่งบอร์ดที่เป็นไปได้ 170 ตำแหน่งซึ่งมากกว่าจำนวนอะตอมในจักรวาล"
กุญแจสำคัญสำหรับความซับซ้อนนี้คือ "รูปแบบการแตกแขนง" ของ Go Hassabis กล่าว ผู้เล่น GO แต่ละคนมีตัวเลือกในการเลือกจากการเคลื่อนไหว 200 ครั้งในแต่ละรอบของเขาเมื่อเทียบกับการเคลื่อนไหวที่เป็นไปได้ 20 ครั้งต่อเทิร์นในหมากรุก นอกจากนี้ยังไม่มีวิธีง่ายๆในการดูบอร์ดและวัดปริมาณที่ผู้เล่นทำได้ดีแค่ไหนในเวลาใดก็ตาม (ในทางตรงกันข้ามผู้คนสามารถได้รับความคิดคร่าวๆว่าใครจะชนะเกมหมากรุกเพียงแค่กำหนดค่าจุดให้กับแต่ละชิ้นที่ยังคงเล่นหรือถูกจับได้ Hassabis กล่าว)
เป็นผลให้ระบบ AI ที่ดีที่สุดเช่น Deep Blue ของ IBM ได้จัดการเพื่อเอาชนะผู้เล่น Human Go มือสมัครเล่นเท่านั้น -10 เทคโนโลยีที่จะเปลี่ยนชีวิตของคุณ-
การเรียนรู้อย่างลึกซึ้ง
ในอดีตผู้เชี่ยวชาญได้สอนลำดับการเคลื่อนไหวเฉพาะของระบบ AI หรือรูปแบบทางยุทธวิธี แทนที่จะใช้วิธีนี้ Hassabis และเพื่อนร่วมงานของเขาได้ฝึกฝนโปรแกรมที่เรียกว่า Alphago โดยไม่ต้องคิดล่วงหน้า
โปรแกรมใช้วิธีการที่เรียกว่าการเรียนรู้ลึกหรือเครือข่ายประสาทลึกซึ่งการคำนวณเกิดขึ้นในหลายชั้นที่มีการจัดลำดับชั้นและโปรแกรมจะป้อนอินพุตจากระดับที่ต่ำกว่าในแต่ละชั้นที่สูงขึ้นอย่างต่อเนื่อง
ในสาระสำคัญอัลฟาโก "ดู" เกมหลายล้านเกมระหว่างมนุษย์เพื่อเรียนรู้กฎการเล่นและกลยุทธ์พื้นฐาน จากนั้นคอมพิวเตอร์ก็เล่นเกมอื่น ๆ นับล้านกับตัวเองเพื่อประดิษฐ์กลยุทธ์ GO ใหม่ ด้วยตัวเองอัลฟาโกจบการศึกษาจากการควบคุมลำดับขั้นพื้นฐานของการเคลื่อนไหวในท้องถิ่นเพื่อจับรูปแบบทางยุทธวิธีที่ใหญ่ขึ้นนักวิจัยกล่าว
เพื่อให้บรรลุภารกิจนี้อัลฟาโกอาศัยเครือข่ายประสาทสองชุด - เครือข่ายมูลค่าซึ่งดูตำแหน่งคณะกรรมการและตัดสินใจว่าใครเป็นผู้ชนะและทำไมและเครือข่ายนโยบายซึ่งเลือกการเคลื่อนไหว เมื่อเวลาผ่านไปเครือข่ายนโยบายได้ฝึกอบรมเครือข่ายมูลค่าเพื่อดูว่าเกมกำลังดำเนินไปอย่างไร
ซึ่งแตกต่างจากวิธีการก่อนหน้านี้ซึ่งพยายามคำนวณประโยชน์ของการเคลื่อนไหวที่เป็นไปได้ทุกครั้งผ่าน Force Brute โปรแกรมจะพิจารณาเฉพาะการเคลื่อนไหวที่น่าจะชนะมากที่สุดนักวิจัยกล่าวซึ่งเป็นวิธีการที่ผู้เล่นที่ดีใช้
“ การค้นหาของเรามองไปข้างหน้าด้วยการเล่นเกมหลายครั้งในจินตนาการ” David Silver ผู้เขียนร่วมการศึกษานักวิทยาศาสตร์คอมพิวเตอร์ที่ Google Deepmind ผู้ช่วยสร้าง Alphago กล่าวในการแถลงข่าว "สิ่งนี้ทำให้อัลฟาโกค้นหาเป็นมนุษย์มากกว่าวิธีการก่อนหน้านี้"
ความพ่ายแพ้ของมนุษย์โดยรวม
การเรียนรู้จากมนุษย์ดูเหมือนจะเป็นกลยุทธ์ที่ชนะ
อัลฟาโกเอาชนะระบบ AI ของคู่แข่งประมาณ 99.8 เปอร์เซ็นต์ของเวลาและเอาชนะแชมป์ยุโรป Go ที่ครองราชย์ Fan Hui ในทัวร์นาเมนต์ชนะทั้งห้าเกม เมื่อเทียบกับระบบ AI อื่น ๆ โปรแกรมสามารถทำงานบนคอมพิวเตอร์เดสก์ท็อปธรรมดาได้แม้ว่าสำหรับการแข่งขันกับฮุ่ยทีมจะเพิ่มพลังการประมวลผลของอัลฟาโกโดยใช้ประมาณ 1,200หน่วยประมวลผลส่วนกลาง(ซีพียู) ที่แยกงานคำนวณ
และอัลฟาโกยังไม่จบกับมนุษย์ มันได้กำหนดสถานที่ท่องเที่ยวของ Lee Sedol ผู้เล่นที่ดีที่สุดในโลกและมีกำหนดการหน้าในไม่กี่เดือน
“ คุณสามารถนึกถึงเขาในฐานะโรเจอร์เฟเดอเรอร์แห่งโลกแห่งโก” Hassabis กล่าว
หลายคนในโลก Go ตกตะลึงด้วยความพ่ายแพ้ - และยังคงมีความหวังสำหรับมนุษย์ที่จะเผชิญหน้ากับอัลฟาโกในเดือนมีนาคม
“ ความแข็งแกร่งของอัลฟาโกนั้นน่าประทับใจอย่างแท้จริง! ฉันรู้สึกประหลาดใจมากพอเมื่อฉันได้ยินแฟนฮุ่ยแพ้ แต่มันรู้สึกจริงมากขึ้นที่จะเห็นบันทึกเกม” ฮาจินลีเลขาธิการสมาพันธ์ระหว่างประเทศ Go กล่าวในแถลงการณ์ "ความประทับใจโดยรวมของฉันคืออัลฟาโกดูแข็งแกร่งกว่าแฟน แต่ฉันไม่สามารถบอกได้ว่าฉันยังคงสงสัยว่ามันแข็งแกร่งพอที่จะเล่นมืออาชีพชั้นนำของโลก แต่บางทีมันอาจจะแข็งแกร่งขึ้นเมื่อเผชิญกับคู่ต่อสู้ที่แข็งแกร่ง"
ติดตาม tia ghose onTwitterและGoogle+-ติดตามวิทยาศาสตร์สด@livescience-Facebook-Google+- บทความต้นฉบับเกี่ยวกับวิทยาศาสตร์สด-