ปัญญาประดิษฐ์มีความก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมา และต้องขอบคุณการพัฒนาเทคนิคการเรียนรู้ของเครื่อง หรือที่เรียกว่า "การเรียนรู้ของเครื่อง" แต่เทคโนโลยีลึกลับนี้ทำงานอย่างไร
การอ่านเช็คอัตโนมัติ, การจดจำรูปภาพ, การรู้จำเสียงพูด, ความช่วยเหลือด้วยเสียง, ระบบขับเคลื่อนอัตโนมัติในรถยนต์, เกมกลยุทธ์, การวิเคราะห์ทางการเงิน, การตรวจจับการฉ้อโกง, เครื่องมือค้นหา, ความช่วยเหลือในการวินิจฉัยทางการแพทย์ ฯลฯ
ปัจจุบันปัญญาประดิษฐ์ได้แพร่กระจายไปเกือบทุกที่และทำให้ชีวิตของเราง่ายขึ้น เทคโนโลยีที่ประสบความสำเร็จมากที่สุดในปัจจุบันคือเทคโนโลยีการเรียนรู้อัตโนมัติหรือ “การเรียนรู้ของเครื่อง” (ML)
เมื่อเราเห็นรถยนต์ขับเคลื่อนอัตโนมัติผ่านไป เมื่อเราสังเกตซอฟต์แวร์หมากรุก หรือเมื่อเราฟังผู้ช่วยแบบเสียง ก็มีเหตุผลที่ทำให้เราต้องประทับใจ แต่ระบบเหล่านี้ยังไม่ฉลาดมากนัก พวกมันยอมให้พวกเขาทำงานที่พิเศษมากได้สำเร็จ โดยที่พวกมันจะเอาชนะมนุษย์ได้ แต่พวกเขาจะไม่สามารถทำอะไรได้อีก เพราะพวกเขาไม่มีสติปัญญาทั่วไป
ความจริงแล้ว ระบบเหล่านี้ไม่มีความเข้าใจในสิ่งที่ระบบทำสำเร็จ เพราะทุกสิ่งที่พวกเขาทำล้วนเป็นผลมาจากการคำนวณทางสถิติเป็นหลัก หนังสือ ML เต็มไปด้วยเทคนิค "ความน่าจะเป็น" การประเมิน "ระยะทาง" "การถดถอย" เชิงเส้นหรือพหุนาม "การไล่ระดับสีสุ่ม" ฯลฯ นี่คือเหตุผลว่าทำไม ML จึงถูกเรียกว่าการเรียนรู้เชิงสถิติ
ข้อมูลขนาดใหญ่และการ์ดกราฟิกจุดประกายผง
ML มีสามรูปแบบหลัก: supervised, unsupervised และ reinforcement แต่เห็นได้ชัดว่านี่เป็นครั้งแรกที่เพิ่มขึ้น และโดยเฉพาะอย่างยิ่งต้องขอบคุณหมวดหมู่ย่อยประเภทหนึ่งซึ่งเป็นการเรียนรู้เชิงลึก เป้าหมายของการเรียนรู้ของเครื่องภายใต้การดูแลคือการสร้างระบบคอมพิวเตอร์ที่สามารถจดจำสิ่งต่างๆ ได้
เพื่อให้บรรลุเป้าหมายนี้ เราจำลององค์ประกอบเหล่านี้ในรูปแบบของ "คุณสมบัติ" เราจัดเตรียมสิ่งต่าง ๆ ที่มีป้ายกำกับจำนวนมากและอัลกอริธึมการเรียนรู้ จากนั้นเราจะเชื่อมโยง "ตุ้มน้ำหนัก" กับคุณลักษณะที่แตกต่างกันเหล่านี้ ซึ่งจะทำให้สามารถแยกแยะเก้าอี้จากแอปเปิ้ลได้ เป็นต้น เพื่อค้นหาน้ำหนักที่เหมาะสม เราขอให้อัลกอริทึมจดจำสิ่งที่ทราบ หากเขาทำผิดพลาด เราจะปรับน้ำหนักเล็กน้อยแล้วเริ่มใหม่อีกครั้งจนกว่าข้อผิดพลาดจะน้อยที่สุด และถ้าทุกอย่างเป็นไปด้วยดี ระบบจะสร้างเมทริกซ์น้ำหนัก ซึ่งเป็นตัวกรองการมองเห็นที่ช่วยให้สามารถจดจำสิ่งต่าง ๆ ได้ดี แม้ว่าจะไม่เคยเห็นมาก่อนก็ตาม
แต่การสร้างแบบจำลองเบื้องต้นของสิ่งต่าง ๆ หรือคำจำกัดความของคุณลักษณะนั้นมีความซับซ้อน และนั่นคือที่ที่การเรียนรู้อย่างลึกซึ้งจะให้วิธีแก้ปัญหา เทคโนโลยีนี้สร้างขึ้นในช่วงทศวรรษปี 1980 ประกอบด้วยการแบ่งย่อยการเรียนรู้ออกเป็นโมดูลต่างๆ ที่สามารถฝึกได้และจัดเรียงเป็นชั้นๆ ตามลำดับ ผลลัพธ์เรียกว่าโครงข่ายประสาทเทียมหลายชั้น
ข้อดีของระบบดังกล่าวก็คือ มันจะสร้างการนำเสนอสิ่งต่าง ๆ แบบลำดับชั้นโดยอัตโนมัติและดึงเอาคุณลักษณะออกมา ไม่จำเป็นต้องการสร้างแบบจำลองด้วยมืออีกต่อไป ในบรรดาโครงข่ายประสาทเทียมหลายชั้น โครงข่ายแบบหมุนวนมีความโดดเด่น คิดค้นโดย Yann Lecun โดยได้รับแรงบันดาลใจจากการทำงานของเปลือกสมองการมองเห็นของสัตว์เลี้ยงลูกด้วยนม และเหมาะอย่างยิ่งสำหรับการจดจำภาพ
แต่การเรียนรู้อย่างลึกซึ้งไม่ได้บินออกไปทันที เฉพาะในปี 2554-2555 เท่านั้นที่นักวิจัยสามารถพึ่งพาฐานข้อมูลขนาดใหญ่ได้ (รูปภาพ 1.2 ล้านภาพกระจายอยู่ใน 1,000 หมวดหมู่ในฐานข้อมูล ImageNet) และในทางกลับกัน กับโปรเซสเซอร์กราฟิกราคาไม่แพง (Nvidia Cuda GPU) เทคโนโลยีนี้เริ่มเข้ามาครอบงำแล้วจริงๆ
“อัตราข้อผิดพลาดที่ลดลงทำให้เกิดการปฏิวัติความเร็วอันน่าทึ่งอย่างแท้จริง ข้ามคืน ทีมวิจัยคำพูดและการมองเห็นส่วนใหญ่ละทิ้งวิธีที่ตนต้องการและย้ายไปที่โครงข่ายประสาทเทียมและโครงข่ายประสาทเทียมอื่นๆYann Lecun อธิบายที่วิทยาลัยเดอฟรองซ์ในปี 2559
ปัจจุบัน ระบบการเรียนรู้แบบมีผู้สอนมีความซับซ้อนเป็นพิเศษ พวกเขาสามารถจัดการได้หลายพันหมวดหมู่และลักษณะเฉพาะหลายร้อยล้านรายการ โครงข่ายประสาทเทียมบางแห่งมีเกิน 150 เลเยอร์แล้ว การพัฒนาที่มีชื่อเสียงที่สุดในการเรียนรู้แบบมีผู้สอนคือระบบขับเคลื่อนอัตโนมัติของ Tesla และ MobileEye
การเรียนรู้รางวัล
แต่การเรียนรู้รูปแบบอื่นไม่ได้พูดคำสุดท้าย โดยเฉพาะการเรียนรู้แบบเสริมกำลังก็มีช่วงเวลาแห่งความรุ่งโรจน์เช่นกัน เทคนิคนี้ไม่ได้ขึ้นอยู่กับการประเมินข้อมูลที่ติดป้ายกำกับ แต่ทำงานตามกระบวนการให้รางวัลประสบการณ์ สิ่งนี้ได้รับการประเมินและป้อนกลับเข้าไปในอัลกอริธึมการเรียนรู้เพื่อปรับปรุงกฎการตัดสินใจและค้นหาวิธีแก้ไขปัญหาที่ดีกว่า
![](http://webbedxp.com/th/tech/misha/app/uploads/2019/03/reinforcement.jpg)
เทคนิคนี้ใช้กันอย่างแพร่หลายในเกม ในปี 2560 บริษัท DeepMind ซึ่งเป็นบริษัทในเครือของ Google ได้สร้างโปรแกรมขึ้นมาอัลฟ่าโกซีโร่ผู้ที่รู้กฎของเกมโกะเท่านั้นจึงไม่สามารถเอาชนะวินัยนี้ได้ภายในเวลา 40 วัน เขาเรียนรู้เกมด้วยการเล่นกับตัวเองโดยไม่ต้องเพิ่มข้อมูลภายนอก ในปีเดียวกันนั้นมาลูบาซึ่งเป็นบริษัทในเครือของ Microsoft นำเสนอระบบการเรียนรู้แบบเสริมกำลังที่ไม่เพียงทำลายสถิติความเป็นมนุษย์ใน Ms. Pac-Man (266,330 คะแนน) แต่ยังทำลายสถิติคะแนนสูงสุดที่เป็นไปได้ (999,990 คะแนน) อีกด้วย
ปัญหาคือการเรียนรู้แบบเสริมกำลังใช้เวลานาน เนื่องจากไม่มีข้อมูลที่ติดป้ายกำกับ การประเมินข้อผิดพลาดจึงทำได้ยากยิ่งขึ้น ดังนั้นคุณต้องทำซ้ำการกระทำหลายครั้ง ความยากของการประเมินนี้ยังขยายออกไปตามความซับซ้อนของสภาพแวดล้อมอีกด้วย เราจะตีความผลลัพธ์ของการทดลองได้อย่างไรในเมื่อมีองค์ประกอบหลายอย่างที่มีอิทธิพลต่อการทดลองนั้น ในกรณีของ Ms. Pac-Man นักวิจัยแก้ไขปัญหานี้ได้โดยใช้เจ้าหน้าที่ที่แตกต่างกัน 150 คน โดยแต่ละรายมุ่งเน้นไปที่ปัญหาเฉพาะ: กู้คืน Pac-Gums ให้ได้มากที่สุดเท่าที่จะเป็นไปได้ หลีกเลี่ยงผีที่มาจากทางขวา และที่มาจาก ซ้าย ฯลฯ ตัวแทนแต่ละคนจะให้ความเห็นเกี่ยวกับการดำเนินการต่อไป การตัดสินใจขั้นสุดท้ายเป็นผลมาจากความคิดเห็นทั้งหมดนี้
อีกวิธีหนึ่งในการควบคุมความซับซ้อนของสภาพแวดล้อมคือการรวมเครือข่ายแบบหมุนวน ถนนสายนี้ถูกสำรวจโดยเฉพาะอย่างยิ่งGoogleซึ่งในปี 2559 ก็ได้แสดงให้เห็นว่าเทคนิคของการเรียนรู้อย่างลึกซึ้งทำให้สามารถแก้ไขการเคลื่อนไหวของแขนหุ่นยนต์อุตสาหกรรมได้ดีขึ้น ในท้ายที่สุด พวกเขาสามารถจับวัตถุได้คล่องมากขึ้นกว่าเดิมมาก
เป็นตัวอย่างอันทะเยอทะยานของมนุษย์
แต่จอกศักดิ์สิทธิ์ยังคงเป็นการเรียนรู้แบบไม่มีผู้ดูแล ซึ่งเป็นรูปแบบการเรียนรู้ตามธรรมชาติของมนุษย์และสัตว์ ไม่จำเป็นต้องมีข้อมูลที่มีป้ายกำกับและอนุญาตให้ซอฟต์แวร์ระบุสิ่งต่าง ๆ ที่พบได้ด้วยตัวเอง เมื่อนำไปใช้กับปัญหาง่ายๆ จะทำให้สามารถประเมินรสนิยมทางดนตรีของผู้ใช้ Spotify หรือเสนอผลงานให้กับลูกค้าของ Amazon ได้
การเรียนรู้แบบไม่มีผู้ดูแลอาศัยเทคนิคที่แตกต่างกัน รวมถึงโครงข่ายประสาทเทียมและอัลกอริธึมการจัดกลุ่ม- ในกรณีหลัง แนวคิดนี้มักจะคำนวณระยะทางทางสถิติระหว่างข้อมูลและระบุกลุ่มขององค์ประกอบที่คล้ายกัน
![](http://webbedxp.com/th/tech/misha/app/uploads/2019/03/unsupervised-learning.jpg)
น่าเสียดายที่นักวิจัยยังไม่ทราบวิธีเข้าถึงการเรียนรู้แบบไม่มีผู้ดูแลสำหรับปัญหาที่ซับซ้อน
นี่เป็นพื้นที่อันกว้างใหญ่ที่ยังไม่ได้สำรวจ“นักวิจัยด้านปัญญาประดิษฐ์ก็ตกอยู่ในสถานการณ์ที่น่าอึดอัดเช่นเดียวกับนักฟิสิกส์ 95% ของมวลในจักรวาลมีธรรมชาติที่ไม่รู้จักโดยสิ้นเชิง นั่นคือ สสารมืดและพลังงานมืด สสารมืดของปัญญาประดิษฐ์คือการเรียนรู้แบบไม่มีผู้ดูแล”Yann Lecun จาก Collège de France อธิบาย สรุปก็คือ ยังไม่ถึงพรุ่งนี้ที่เครื่องจักรจะเข้ามาใช้พลังงาน
🔴 เพื่อไม่พลาดข่าวสาร 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-