Waymo 刚刚发布了一份关于自动驾驶端到端多模式模型的研究报告,该模型基于谷歌的人工智能 Gemini。据该公司称,它将能够模仿人类推理,将复杂的任务分解为一系列逻辑步骤。
人工智能一直与自动驾驶有着千丝万缕的联系。但出于安全原因,某些当今无人驾驶汽车最先进的公司更喜欢更简单的模型,以避免任何幻觉或新情况,这将产生欺骗基于人工智能的机器的效果。
在谷歌母公司的子公司Waymo,人工智能仍然会得到很好的整合在其自动驾驶汽车中。该公司宣布正在与Gemini,谷歌的人工智能,创建一个用于自动驾驶的大型端到端多模态语言模型(MLLM),能够生成“自动驾驶汽车的未来轨迹”,并根据障碍做出正确的决定。
一个能够模仿人类推理的系统?
简单来说,人工智能不会基于每个驾驶功能的特定模块,无论是地图、感知还是规划,而是基于一个更完整的系统,具有更完整的推理能力,准备好进化和发展。面对新环境。一个能够模仿人类推理、将复杂任务分解为一系列逻辑步骤的系统。
然而,由于幻觉,将人工智能集成到驾驶系统中始终面临风险。但 Waymo 的做法表明,没有人工智能的自动驾驶似乎也面临障碍。到目前为止,Waymo 仅在旧金山、洛杉矶和凤凰城的部分城市地区提供自动驾驶出租车,此外还在奥斯汀和山景城进行了测试。足以理解,这个级别的自动驾驶需要事先做好良好的测绘和大量的现场培训。
面对特斯拉,Waymo 还必须在支持其汽车中 Gemini AI 运行的传感器方面做出选择。因为如果特斯拉使用简单的摄像头,Waymo 使用 LiDAR 和 3D 雷达传感器,这些传感器在计算方面要昂贵得多,谷歌子公司承认。为了使您的系统端到端工作,您必须转向更传统的相机,因此,从某种意义上说,证明竞争是正确的。埃隆·马斯克的公司和他的机器人出租车。