Waymo 剛剛發布了一份關於自動駕駛端到端多模式模型的研究報告,該模型基於Google的人工智慧 Gemini。據該公司稱,它將能夠模仿人類推理,將複雜的任務分解為一系列邏輯步驟。
人工智慧一直與自動駕駛有著千絲萬縷的關係。但出於安全原因,某些當今無人駕駛汽車最先進的公司更喜歡更簡單的模型,以避免任何幻覺或新情況,這將產生欺騙基於人工智慧的機器的效果。
在Google母公司的子公司Waymo,人工智慧仍然會得到很好的整合在其自動駕駛汽車中。該公司宣布正在與Gemini,Google的人工智慧,建立一個用於自動駕駛的大型端對端多模態語言模型(MLLM),能夠生成“自動駕駛汽車的未來軌跡”,並根據障礙做出正確的決定。
一個能夠模仿人類推理的系統?
簡單來說,人工智慧不會基於每個駕駛功能的特定模組,無論是地圖、感知或規劃,而是基於一個更完整的系統,具有更完整的推理能力,準備好進化和發展。環境。一個能夠模仿人類推理、將複雜任務分解為一系列邏輯步驟的系統。
然而,由於幻覺,將人工智慧整合到駕駛系統中始終面臨風險。但 Waymo 的做法表明,沒有人工智慧的自動駕駛似乎也面臨障礙。到目前為止,Waymo 僅在舊金山、洛杉磯和鳳凰城的部分城市地區提供自動駕駛計程車,此外還在奧斯汀和山景城進行了測試。足以理解,這個等級的自動駕駛需要事先做好良好的測繪和大量的現場訓練。
面對特斯拉,Waymo 還必須在支援其汽車中 Gemini AI 運行的傳感器方面做出選擇。因為如果特斯拉使用簡單的攝像頭,Waymo 使用 LiDAR 和 3D 雷達感測器,這些感測器在計算方面要昂貴得多,谷歌子公司承認。為了使您的系統端到端工作,您必須轉向更傳統的相機,因此,從某種意義上說,證明競爭是正確的。伊隆馬斯克的公司和他的機器人計程車。