一支學術研究人員有發達動態點像素具有稱為DPPFA-NET的特徵對齊網絡,以解決準確檢測機器人和自動駕駛汽車的小物體的問題。與其他現有的3D對象檢測方法相比,該模型在平均精度上顯示出顯著提高,在各種噪聲條件下增長了7.18%。
汽車製造商一直在為諸如創世紀GV60為了門解鎖,即使智能汽車開發人員在滿足自動駕駛汽車的計算機視覺要求所需的各種光學傳感器上都有不同的位置。關於其他應用需要哪種相機的共識可能會決定成像系統生物識別技術必須使用的成像系統。
儘管對自動駕駛汽車和機器人自動化解決方案的需求不斷增長,但對象檢測仍然是AI工作量中的一項複雜任務。這個挑戰的關鍵方面涉及使用激光傳感器,生成3D點雲,提供有關周圍環境的深度信息。但是,LiDAR數據易受噪聲的影響,可能導致對象檢測錯誤。
為了解決這個問題,由日本Ritsumeikan University的Hiroyuki Tomiyama教授領導的團隊已引入將3D激光雷達數據與標準攝像機捕獲的2D RBG圖像相結合的多模式3D對象檢測方法。該研究強調了它在機器人技術領域的重要性,因為它使機器人能夠更好地了解並適應其環境。
Tomiyama解釋說:“我們的研究可以促進對機器人對工作環境的更好理解和適應,從而使對小目標的更精確感知。” “這些進步將有助於提高機器人在各種應用中的功能。”
所提出的系統包括幾個模塊:基於內存的點像素融合模塊(MPPF),可變形點像素融合模塊(DPPF)和語義對準評估器(SAE)模塊。這些各種專業模塊都集成在一起,以增強對象檢測的準確性和魯棒性,這些複雜場景以潛在的環境噪聲為特徵。
基於內存的點像素融合模塊有助於相同模態和不同模態內特徵之間的相互作用。該模塊將2D圖像用作存儲庫,從而使網絡能夠學習並適應3D點雲數據中的噪聲。相反,可變形點像素融合模塊的重點是在特定像素位置處的相互作用,保持高分辨率,同時保持計算複雜性較低。
“ DPPF模塊僅基於採樣策略建立了與關鍵位置像素的互動。此設計不僅可以保證低計算的複雜性,而且還可以使自適應融合功能功能,尤其有利於高分辨率圖像。SAE模塊可以確保融合功能的語義對齊,從而增強了融合性和可靠性,從而增強了融合過程的可靠性。
在評估動態點像素特徵對齊網絡期間,研究團隊將人工多模式噪聲引入了Kitti數據集。根據該研究的發現,提議的網絡是最先進和準確的3D之一對象檢測可用的方法。