ทีมนักวิจัยเชิงวิชาการมีพัฒนาเครือข่ายการจัดตำแหน่งจุดพิกเซลแบบไดนามิกที่รู้จักกันในชื่อ DPPFA-NET เพื่อแก้ไขปัญหาการตรวจจับวัตถุขนาดเล็กอย่างแม่นยำสำหรับหุ่นยนต์และยานพาหนะอัตโนมัติ เมื่อเปรียบเทียบกับวิธีการตรวจจับวัตถุ 3 มิติที่มีอยู่อื่น ๆ รุ่นนี้แสดงให้เห็นถึงการปรับปรุงที่สำคัญในความแม่นยำโดยเฉลี่ยซึ่งเพิ่มขึ้น 7.18 เปอร์เซ็นต์ในสภาพเสียงรบกวนต่าง ๆ
ผู้ผลิตรถยนต์ได้เพิ่มใบหน้าชีวภาพให้กับยานพาหนะเช่นปฐมกาล GV60สำหรับการปลดล็อคประตูแม้ในขณะที่นักพัฒนายานยนต์อัจฉริยะมีส่วนร่วมในตำแหน่งที่แตกต่างกันในประเภทของเซ็นเซอร์ออปติคัลที่พวกเขาต้องการเพื่อให้เป็นไปตามข้อกำหนดการมองเห็นคอมพิวเตอร์ของยานพาหนะอัตโนมัติ ฉันทามติเกี่ยวกับประเภทของกล้องที่จำเป็นสำหรับแอปพลิเคชันอื่น ๆ อาจกำหนดว่านักพัฒนาระบบการถ่ายภาพ Biometrics ต้องทำงานด้วย
แม้จะมีความต้องการที่เพิ่มขึ้นสำหรับยานพาหนะอัตโนมัติและโซลูชั่นหุ่นยนต์อัตโนมัติ แต่การตรวจจับวัตถุยังคงเป็นงานที่ซับซ้อนภายในเวิร์กโหลด AI สิ่งสำคัญของความท้าทายนี้เกี่ยวข้องกับการใช้งานเซ็นเซอร์ LIDARซึ่งสร้างเมฆจุด 3 มิติที่ให้ข้อมูลเชิงลึกเกี่ยวกับสภาพแวดล้อมโดยรอบ อย่างไรก็ตามข้อมูล LIDAR มีความไวต่อเสียงรบกวนซึ่งอาจทำให้เกิดข้อผิดพลาดในการตรวจจับวัตถุ
เพื่อแก้ไขปัญหานี้ทีมที่นำโดยศาสตราจารย์ Hiroyuki Tomiyama จากมหาวิทยาลัย Ritsumeikan ในญี่ปุ่นมีที่ได้รับการแนะนำวิธีการตรวจจับวัตถุ 3D แบบหลายโมดอลที่รวมข้อมูล LIDAR 3D กับภาพ 2D RBG ที่ถ่ายด้วยกล้องมาตรฐาน การวิจัยเน้นความสำคัญที่เกิดขึ้นในสาขาหุ่นยนต์เนื่องจากช่วยให้หุ่นยนต์ได้รับความเข้าใจและปรับตัวเข้ากับสภาพแวดล้อมของพวกเขาได้ดีขึ้น
“ การศึกษาของเราสามารถอำนวยความสะดวกให้กับความเข้าใจและการปรับตัวของหุ่นยนต์ให้เข้ากับสภาพแวดล้อมการทำงานของพวกเขาทำให้การรับรู้ที่แม่นยำยิ่งขึ้นเกี่ยวกับเป้าหมายขนาดเล็กที่แม่นยำยิ่งขึ้น” Tomiyama อธิบาย “ ความก้าวหน้าดังกล่าวจะช่วยปรับปรุงความสามารถของหุ่นยนต์ในแอปพลิเคชันต่างๆ”
ระบบที่นำเสนอประกอบด้วยโมดูลหลายโมดูล: โมดูลฟิวชั่นจุดพิกเซลที่ใช้หน่วยความจำ (MPPF), โมดูลฟิวชั่นพิกเซลจุดพิกเซล (DPPF) และโมดูลการจัดตำแหน่งความหมาย (SAE) โมดูลเฉพาะที่หลากหลายเหล่านี้ได้รับการรวมเข้าด้วยกันเพื่อเพิ่มความแม่นยำและความทนทานของการตรวจจับวัตถุในสถานการณ์ที่ซับซ้อนซึ่งโดดเด่นด้วยเสียงด้านสิ่งแวดล้อมที่อาจเกิดขึ้น
โมดูลฟิวชั่นจุดพิกเซลที่ใช้หน่วยความจำช่วยอำนวยความสะดวกในการโต้ตอบระหว่างคุณสมบัติภายในรูปแบบเดียวกันรวมถึงในรังสีที่แตกต่างกัน โมดูลใช้ภาพ 2D เป็นธนาคารหน่วยความจำทำให้เครือข่ายสามารถเรียนรู้และปรับให้เข้ากับเสียงรบกวนในข้อมูลคลาวด์จุด 3 มิติ ในทางตรงกันข้ามโมดูลฟิวชั่นพิกเซลจุดพิกเซลที่เปลี่ยนรูปได้มุ่งเน้นไปที่การโต้ตอบที่ตำแหน่งพิกเซลที่เฉพาะเจาะจงรักษาความละเอียดสูงในขณะที่รักษาความซับซ้อนในการคำนวณไว้ต่ำ
“ โมดูล DPPF สร้างการโต้ตอบโดยเฉพาะกับพิกเซลตำแหน่งสำคัญตามกลยุทธ์การสุ่มตัวอย่างการออกแบบนี้ไม่เพียง แต่รับประกันความซับซ้อนในการคำนวณต่ำ แต่ยังช่วยให้ฟังก์ชั่นฟิวชั่นแบบปรับตัวได้โดยเฉพาะอย่างยิ่งประโยชน์สำหรับภาพความละเอียดสูง
ในระหว่างการประเมินเครือข่ายการจัดตำแหน่งคุณสมบัติจุดพิกเซลแบบไดนามิกทีมวิจัยได้แนะนำเสียงรบกวนหลายรูปแบบเทียมลงในชุดข้อมูล Kitti จากผลการศึกษาของการศึกษาเครือข่ายที่เสนอนั้นโดดเด่นเป็นหนึ่งใน 3D ที่ทันสมัยที่สุดและแม่นยำที่สุดการตรวจจับวัตถุมีวิธีการที่มีอยู่
หัวข้อบทความ
เมฆจุด 3 มิติ-AI-ชีวภาพยานยนต์-ไบโอเมตริกซ์-วิสัยทัศน์คอมพิวเตอร์-การตรวจจับวัตถุ-เซ็นเซอร์ออปติคัล