หลังจากการทำงานหนักมานานกว่าสองปี นักวิจัยจาก DeepMind ซึ่งเป็นบริษัทในเครือของ Alphabet ได้ประสบความสำเร็จในการรับรองว่า AI ของพวกเขาจะสามารถสร้างภาพวัตถุที่เหมือนจริงได้... เช่น เบอร์เกอร์
เราสามารถไว้วางใจชีสเบอร์เกอร์เพื่อประเมินความก้าวหน้าของปัญญาประดิษฐ์ได้หรือไม่? แม้ว่าคำถามจะดูแปลก แต่ก็มีเหตุผลทั้งหมด ตามที่อธิบายไว้ควอตซ์AI จาก DeepMind บริษัทในเครือ Alphabet สามารถสร้างภาพที่สมจริงมากกว่าเมื่อ 2 ปีที่แล้วได้มาก โดยเฉพาะภาพถ่ายชีสเบอร์เกอร์
ให้เราเน้นย้ำในกรณีที่จำเป็น เราไม่ได้พูดถึงแค่ขั้นตอนการรับรู้ภาพเท่านั้น แต่ยังเกี่ยวกับการสร้างสรรค์เกือบตั้งแต่เริ่มต้นของการแสดงวัตถุที่สมจริงด้วย AI เป้าหมายของ Deepmind คือปัญญาประดิษฐ์จะสามารถสร้างภาพจากคำพูดได้ในที่สุด

การฝึก AI เป็นคู่
เพื่อให้บรรลุเป้าหมายนี้ บริษัทในเครือของ Alphabet จึงใช้ GAN สำหรับเครือข่ายที่สร้างความขัดแย้ง มีพื้นฐานมาจากแนวคิดที่ดูเรียบง่ายซึ่งนำเสนอโดยนักวิจัยของ Google ในปี 2014 ประกอบด้วยการถามอัลกอริธึมเพื่อสร้างภาพ ในขณะที่โครงข่ายประสาทเทียมที่สองจะต้องตัดสินว่าผลลัพธ์นั้นสมจริงหรือไม่ ดังนั้น คนแรกเรียนรู้ทีละน้อยเพื่อสร้างภาพถ่ายที่เหมือนจริงภายใต้การแนะนำของวินาที
ผลลัพธ์ที่ได้ดูเหมือนจะน่าเชื่อถือ ดังที่เราเห็นในตัวอย่างด้านบน เบอร์เกอร์ปี 2018 ดูสมจริงและน่ารับประทานมากกว่าเบอร์เกอร์ปี 2016 ทางด้านขวา
ในบทความทางวิทยาศาสตร์ของพวกเขานักวิจัยของ Deepmind อธิบายรายละเอียดเพิ่มเติมว่าพวกเขาฝึก AI ของตนอย่างไร โดยเฉพาะอย่างยิ่งพวกเขาให้รายละเอียดการมีส่วนร่วมในหลักการของ GAN อัลกอริธึมของพวกเขาในความเป็นจริงสามารถจัดการรูปภาพได้มากขึ้น 2048 เทียบกับ 256 ก่อนหน้านี้ สิ่งนี้จึงเพิ่มจำนวนตัวอย่างวัตถุชีสเบอร์เกอร์ที่ขึ้นอยู่กับปัญญาประดิษฐ์ นอกจากนี้ วิศวกรของ Deepmind ยังได้จัดการเพื่อให้แน่ใจว่าภาพที่วิเคราะห์และผลิตมีคุณภาพดีขึ้น
เพิ่มความคมชัดของภาพต้นฉบับ
จนถึงขณะนี้ ปัญญาประดิษฐ์ ImageNet ของพวกเขาได้รับการฝึกฝนด้วยรูปภาพที่มีความละเอียด 128 x 128 พิกเซล สิ่งนี้อาจดูต่ำ แต่ปัญญาประดิษฐ์จะวิเคราะห์รูปภาพจำนวนนับไม่ถ้วนเพื่อเรียนรู้ และโดยเฉพาะอย่างยิ่งความยากลำบากในการสร้างภาพถ่ายที่มีความคมชัดสูงเกินไป
การเพิ่ม “ขนาด” ของภาพยังคงต้องใช้พลังการประมวลผลจำนวนมาก และเพิ่มความเสี่ยงที่จะเกิดข้อผิดพลาดระหว่างการสร้าง สำหรับภาพที่มีความละเอียดต่ำ จริงๆ แล้วจำเป็นต้องใช้พิกเซลน้อยลงในการสร้างภาพที่มีความสอดคล้องกัน
อย่างไรก็ตาม นักวิจัยสามคนที่รับผิดชอบโครงการนี้ได้ทดสอบการฉีดรูปภาพขนาด 256 x 256 และ 512 x 512 พิกเซลด้วยผลลัพธ์ที่น่าพึงพอใจ ดัชนีความสมจริงของโมเดลที่สร้างโดย AI จึงเพิ่มขึ้น ไม่ว่าจะเป็นสุนัข แมว ทิวทัศน์ ผีเสื้อ หรือแม้แต่ชีสเบอร์เกอร์ ทั้งหมดนี้มีความสมจริงมากกว่าเมื่อสองปีที่แล้วมาก
แน่นอนว่า ยังมีหนทางอีกยาวไกลในการเพื่อให้ได้ภาพที่มีความคมชัดสูงและเหนือสิ่งอื่นใดคือผลลัพธ์ที่ประสบความสำเร็จในแต่ละครั้ง ตัวอย่างเช่น ImageNet ได้รับการฝึกฝนให้ย้ายจากภาพหนึ่งไปยังอีกภาพหนึ่งโดยการสร้างภาพการเปลี่ยนแปลง จากนั้นเราก็ได้ผลลัพธ์ที่แปลกมากเช่นนี้ ในระหว่างการเปลี่ยนแปลงระหว่างสุนัขกับแมว
🔴 เพื่อไม่พลาดข่าวสาร 01net ติดตามเราได้ที่Google ข่าวสารetวอทส์แอพพ์-