NVIDIA揭幕了新的AI技术，该技术从文本提示中创建高分辨率3D模型

2023-02-02

生成人工智能（AI）目前正在统治科技界。但是总部位于美国的GPU制造商NVIDIA希望在这个萌芽的领域增加“更多维度”。

因此，这家技术巨头揭幕了魔术3D- 高分辨率生成的AI，可从任何给定的文本提示创建3D模型。

文本到3D内容创建

生成AI是任何生成新图像，视频，文本，音频甚至代码的AI软件的总体标签。常见的例子包括AI艺术生成器，例如稳定的扩散，Midjourney等。

分析师预报这个不断发展的领域将进一步刺激，到2030年，这将成为一个巨大的1,100亿美元市场。

Nvidia透露其Magic3D Tech之后，Nvidia似乎在这个市场上跳入了这个市场。该公司表示，它可以根据输入文本提示生成高质量的3D纹理网格模型。

它还采用了一个粗到精细的过程，该过程利用低分辨率扩散先验来理解和复制预期目标含量的3D表示。

简而言之，如果您想拥有任何类型的对象，例如黑色连衣裙，Magic3D将为您提供文本提示的3D网格模型。

它甚至可以从时髦的提示中产生3D型号，例如用寿司制成的汽车，冲浪板上的孔雀以及更具体和更详细的提示，例如迈克尔·安吉洛（Michael Angelo）式的宇航员雕像或坐在红色天鹅绒桌上的银色烛台上，并带有唯一的蜡烛点燃。

您可以看到这些提示的3D网格型号这里。

必须指出的是，这些示例是从Nvidia在其网站上提供的提示中得出的。它表明，新的AI技术可以通过高度特定的提示生成模型。

此外，该公司声称Magic3D合成3D内容，分辨率高8倍，比2倍的速度快2倍梦想，一种使用2D扩散的文本到3D技术。

Nvidia还说他们可以编辑输入文本提示，以修改已经生成的3D模型。例如，新技术背后的团队通过更改坐在煎饼上的小兔子的网格模型来展示此编辑功能，再到坐在一堆西兰花的顶部的金属兔子。

魔术3D还可以借助Dreambooth微调扩散模型，并优化3D模型。

该团队说：“该主题的身份可以在3D模型中得到良好保存。”

该团队使用两阶段的粗到最新优化框架来确保创建快速，高质量的文本对3D内容。

在第一阶段使用低分辨率扩散的先验，以产生粗糙的模型，然后使用哈希网格和稀疏的加速结构加速。

在第二阶段，采用从粗神经表示初始化的纹理网格模型，用于使用高分辨率潜在扩散模型与可区分渲染器结合使用。