研究人员建立了一个新的“多元宇宙模拟”平台,可以生成大量数据来训练先进的自学习机器人(人工智能)。
据设计该平台的英伟达称,这套被称为“Cosmos”的工具可以让研究人员创建“世界基础模型”——模拟现实世界环境和物理定律的神经网络,以预测现实结果。这些生成式人工智能模型可以创建合成数据来训练例如自动驾驶汽车 (AV) 或人形机器人。
训练人工智能系统需要大量数据,但科学家估计我们。与现实世界交互的人工智能系统(例如机器人)通常需要现实世界的镜头,而这些镜头的制作极其困难且获取成本高昂。
但创建真正有用的合成数据也具有挑战性,一项研究之前警告说可能会分解成难以理解的废话。 Cosmos 旨在通过让科学家根据现实世界的物理原理快速生成大量人工视频片段来解决这些问题。
有关的:
“今天的人形开发人员有数百名人类操作员进行数千次重复演示,只是为了教授一些技能,”勒巴雷迪安牧师Nvidia Omniverse 和模拟技术副总裁周一(1 月 6 日)在拉斯维加斯 CES 2025 举行的虚拟新闻发布会上表示。 “当今的 AV 开发人员需要行驶数百万英里;处理、过滤和标记捕获的数千 PB 数据甚至需要更密集的资源,而物理测试是危险的。当一个机器人原型可能花费数百美元时,人形开发人员会损失惨重。数千美元。”
模拟多元宇宙
这个新平台的一个关键组成部分是多元宇宙模拟,其中 Cosmos 与 Nvidia 的 Omniverse 软件系统相结合,在特定场景下生成未来所有可能的结果。然后将其输入机器人或自动驾驶汽车的训练中。
它使用图像生成中使用的扩散模型(机器学习算法,通过向数据集中添加“噪声”(粒度规格)然后学习消除噪声来生成数据)以及自回归模型,这是用于预测下一个数据的统计模型流程中的一步。总之,该平台可以接收文本、图像或视频,然后生成片段来实时预测特定场景中接下来会发生什么。
“机器人技术的 ChatGPT 时刻即将到来。与大型语言模型一样,世界基础模型是推进机器人和 AV 开发的基础,但并非所有开发人员都拥有培训自己的专业知识和资源,”黄仁勋英伟达创始人兼首席执行官在一份声明中表示。 “我们创建 Cosmos 是为了实现物理人工智能的民主化,并使通用机器人技术触手可及。”
使用 Cosmos 创建的世界基础模型也可根据开源许可条款使用。