รอยยิ้มที่ลึกลับและทาสีของ "โมนาลิซ่า" เป็นที่รู้จักกันทั่วโลก แต่ใบหน้าที่มีชื่อเสียงนั้นเพิ่งแสดงการแสดงออกที่หลากหลายที่น่าตกใจปัญญาประดิษฐ์(AI).
ในวิดีโอแชร์ไปที่ YouTubeในวันที่ 21 พฤษภาคมคลิปวิดีโอสามรายการแสดงตัวอย่างที่ไม่แน่นอนของโมนาลิซ่าขณะที่เธอขยับริมฝีปากของเธอและหันหัวของเธอ เธอถูกสร้างขึ้นโดยเครือข่ายประสาทแบบ convolutional - ประเภทของ AI ที่ประมวลผลข้อมูลมากเท่ากับสมองมนุษย์เพื่อวิเคราะห์และประมวลผลภาพ
นักวิจัยได้ฝึกฝนอัลกอริทึมเพื่อทำความเข้าใจรูปร่างทั่วไปของใบหน้าและวิธีการที่พวกเขามีพฤติกรรมซึ่งกันและกันแล้วนำข้อมูลนั้นไปใช้กับภาพนิ่ง ผลที่ได้คือลำดับวิดีโอที่สมจริงของการแสดงออกทางสีหน้าใหม่จากเฟรมเดียว -เครื่องจักรสามารถสร้างสรรค์ได้หรือไม่? พบ 9 AI 'ศิลปิน'-
สำหรับวิดีโอ Mona Lisa การเคลื่อนไหวบนใบหน้า "เรียนรู้" AI จากชุดข้อมูลของมนุษย์สามวิชาสร้างภาพเคลื่อนไหวที่แตกต่างกันสามแบบ ในขณะที่แต่ละคลิปทั้งสามยังคงเป็นที่รู้จักในฐานะโมนาลิซ่ารูปแบบของรูปแบบการฝึกอบรมและพฤติกรรมให้ "บุคลิก" ที่แตกต่างกันไปยัง "ภาพชีวิต" Egor Zakharov วิศวกรของสถาบันวิทยาศาสตร์และเทคโนโลยี Skolkovo และ Samsung AI Center
Zakharov และเพื่อนร่วมงานของเขายังสร้างภาพเคลื่อนไหวจากภาพถ่ายของไอคอนวัฒนธรรมในศตวรรษที่ 20 เช่นอัลเบิร์ตไอน์สไตน์, มาริลีนมอนโรและซัลวาดอร์ดาลี นักวิจัยอธิบายการค้นพบของพวกเขาซึ่งไม่ได้ตรวจสอบโดยเพื่อนในการศึกษาที่ตีพิมพ์ออนไลน์ 20 พฤษภาคมในวารสาร preprintarxiv-
การผลิตวิดีโอต้นฉบับเช่นนี้เรียกว่า Deepfakes ไม่ใช่เรื่องง่าย หัวมนุษย์มีความซับซ้อนทางเรขาคณิตและมีพลวัตสูง รุ่น 3D ของหัวมี "พารามิเตอร์หลายสิบล้านตัว" ผู้เขียนการศึกษาเขียน
ยิ่งไปกว่านั้นระบบการมองเห็นของมนุษย์นั้นดีมากในการระบุ "แม้แต่ความผิดพลาดเล็กน้อย" ในหัวมนุษย์แบบ 3 มิติตามการศึกษา การได้เห็นบางสิ่งบางอย่างที่ดูเกือบเป็นมนุษย์ - แต่ไม่มากนัก - กระตุ้นความรู้สึกไม่สบายใจที่รู้จักกันในชื่อเอฟเฟกต์ Vanny Valley-
AI ก่อนหน้านี้แสดงให้เห็นว่าการผลิต Deepfakes ที่น่าเชื่อถือนั้นเป็นไปได้ แต่ต้องใช้หลายมุมของเรื่องที่ต้องการ สำหรับการศึกษาใหม่วิศวกรได้แนะนำ AI ให้เป็นชุดข้อมูลขนาดใหญ่มากของวิดีโออ้างอิงที่แสดงใบหน้าของมนุษย์ในการดำเนินการ- นักวิทยาศาสตร์ได้จัดตั้งสถานที่สำคัญบนใบหน้าที่จะใช้กับใบหน้าใด ๆ เพื่อสอนเครือข่ายประสาทอย่างไรใบหน้าโดยทั่วไป
จากนั้นพวกเขาฝึก AI ให้ใช้นิพจน์อ้างอิงเพื่อทำแผนที่การเคลื่อนไหวของคุณสมบัติของแหล่งที่มา สิ่งนี้ทำให้ AI สามารถสร้าง deepfake ได้แม้ว่าจะมีเพียงภาพเดียวที่จะทำงานจากนักวิจัยรายงาน
และภาพแหล่งที่มาเพิ่มเติมส่งผลลัพธ์ที่มีรายละเอียดมากขึ้นในภาพเคลื่อนไหวขั้นสุดท้าย วิดีโอที่สร้างขึ้นจาก 32 ภาพแทนที่จะเป็นเพียงภาพเดียวที่ประสบความสำเร็จ "ความสมจริงที่สมบูรณ์แบบ" ในการศึกษาผู้ใช้นักวิทยาศาสตร์เขียน
- ปัญญาประดิษฐ์: เป็นมิตรหรือน่ากลัว?
- 5 การใช้งานที่น่าสนใจสำหรับปัญญาประดิษฐ์ (ซึ่งไม่ใช่หุ่นยนต์นักฆ่า)
- สูตรสำหรับการจำลอง: 5 ขั้นตอนในการสร้าง Android สไตล์นักวิ่งใบมีด
เผยแพร่ครั้งแรกเมื่อวิทยาศาสตร์สด-