AlphaZero ซึ่งเป็นเวอร์ชันใหม่ของโปรแกรมแชมป์เปี้ยนของ Go กลายเป็นเกมหมากรุกและโชกิที่ไม่มีใครเทียบได้ด้วยความเร็วอันน่าทึ่ง ซึ่งพิสูจน์ว่าวิธีการเรียนรู้สามารถเป็นแบบทั่วไปได้
เรารู้ว่าเครื่องจักรนี้แข็งแกร่งกว่ามนุษย์ในการเล่นหมากรุกนับตั้งแต่คาสปารอฟล้มเหลวกับ Deep Blue ในปี 1997 บริษัท DeepMind ซึ่งเป็นของ Alphabet เพิ่งประสบความสำเร็จอย่างที่ไม่เคยพบเห็นมาก่อนในสาขานี้ ยิ่งไปกว่านั้น นักวิจัยก็เป็นที่รู้จักอย่างกว้างขวางแล้ว วันนี้จะนำเสนอ AlphaZero ปัญญาประดิษฐ์เวอร์ชันล่าสุดในบทความทางวิทยาศาสตร์ที่เพิ่งส่งเพื่อตีพิมพ์บนเว็บไซต์อาร์เอ็กซ์-
โครงข่ายประสาทเทียมเรียนรู้ที่จะเล่นหมากรุก แต่ยังรวมถึงโชกิซึ่งเป็นเกมหมากรุกญี่ปุ่นที่มีระดับความซับซ้อนสูงกว่า และในที่สุดก็ฝึกฝนการต่อสู้กับตัวมันเอง จากนั้นเขาก็ก้าวข้ามระดับโปรแกรมหมากรุกคอมพิวเตอร์ระดับดาว Stockfish ในเวลาเพียงสี่ชั่วโมง เอาชนะ Elmo ปรมาจารย์โชกิเทียมในเวลาไม่ถึงสองชั่วโมงด้วย และในที่สุดก็ก้าวไปข้างหน้าอัลฟ่าโก ลี– AI ที่เอาชนะ Lee Sedol – หลังจากผ่านไปแปดชั่วโมง จากนั้นเขาก็เผชิญหน้ากับซอฟต์แวร์ระดับแชมป์เหล่านี้โดยตรงในการแข่งขัน 100 เกมที่ดำเนินไปอย่างรวดเร็ว เขาไม่ชนะทุกครั้ง โดยเสียความพ่ายแพ้และเสมอบ้างเล็กน้อย แต่กลับได้รับชัยชนะอย่างมาก โดยรวมแล้วเขาใช้เวลา 24 ชั่วโมงกว่าจะเก่งที่สุดในสามเกมที่แยกจากกันนี้
เรียนรู้ตั้งแต่เริ่มต้น
โปรดจำไว้ว่าเวอร์ชันก่อนหน้าอัลฟ่าโก ซีโร่ได้พิสูจน์ให้เห็นแล้วเมื่อเดือนตุลาคมปีที่แล้วว่าสามารถเอาชนะแชมป์ปัญญาประดิษฐ์ของ Go ได้ทั้งหมดในเวลาเพียง 40 วัน AlphaZero อาศัยอัลกอริธึมที่แตกต่างกันเล็กน้อย“มันเป็นเวอร์ชันทั่วไปมากกว่า”ระบุถึงทีม DeepMind ในบทความ ดังนั้นจึงไม่ได้ออกแบบมาโดยเฉพาะเพื่อให้ชนะที่ Go แต่สำหรับเกมแบบผสมใด ๆ ด้วยการกำหนดค่าคอมพิวเตอร์โดยเฉพาะเสมอเนื่องจากบริษัทมีความสามารถในการประมวลผลมหาศาลด้วย TPU เพียง 4 ตัวซึ่งเป็นโปรเซสเซอร์ที่ออกแบบมาสำหรับโปรแกรมการเรียนรู้ของเครื่อง ในส่วนของ AlphaGo Zero
วิธีการก็ยังเหมือนเดิม“มันเกี่ยวกับการใช้การเรียนรู้แบบเสริมกำลังแบบไม่มีผู้ดูแล กล่าวคือ ตั้งแต่เริ่มต้น”สังเกต Tristan Cazeneuve ศาสตราจารย์แห่ง Paris Dauphine University และผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ แทนที่จะกินเกมนับล้านที่เล่นโดยมนุษย์เพื่อเรียนรู้จากพวกมันและเลียนแบบการเคลื่อนไหวที่ยอดเยี่ยมที่สุด แนวคิดก็คือความก้าวหน้า« ทาบูลา ราซา »นั่นคือเพียงการทดลองและเล่นกับตัวเองเท่านั้น โดยมีกติกาของเกมเป็นจุดเริ่มต้นเท่านั้น
“สิ่งที่ DeepMind เพิ่งพิสูจน์ในครั้งนี้คือความสามารถในการสรุปอัลกอริทึม ซึ่งขณะนี้สามารถพิจารณานำกลับมาใช้ในพื้นที่อื่นๆ ได้แล้ว”ขีดเส้นใต้ Tristan Cazenave สิ่งนี้ตอกย้ำความหวังในวันหนึ่งในการใช้ซอฟต์แวร์ที่ดึงมาจากการทดลองเหล่านี้ในด้านพลังงาน การขนส่ง หรือแม้แต่ชีวสารสนเทศศาสตร์
🔴 เพื่อไม่พลาดข่าวสาร 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-