“为未来播下种子,尝试登上月球,同时提供具体、适用、有益的东西是很困难的”。这是 Nvidia 研究主管 Bill Dally 在第十届 GTC 开幕之前所说的实质内容。
不要停留在它的界面上
当两位研究人员上台展示仍处于实验阶段的工具时,我们脑海中仍然浮现出这句话。界面类似于Windows 3.1下的绘图软件。在左侧的垂直栏中,三个糟糕的工具等待着人们记住它们的存在,而屏幕的下部则被放置在按钮上的文字占据,就像 HTML 4 网站的按钮一样优雅。
“海、天、草、云、水、雪、山、木、砾”, ETC。名单很长。 Nvidia 深度学习应用副总裁 Bryan Catanzaro 表示,这是一个语义调色板,然后让 Nvidia 研究员 Ming-Yu Liu 开始绘制一系列模糊的涂鸦。它们看起来更像是屏幕左侧的极简主义平坦颜色区域。
然后我们很快就明白了左边的粗糙形状和线条在右边有对应的形状和线条。事实上,左边的部分可能是天空的幼稚和几何版本,然后是有树木、日落和尖锐山峰的山地景观。事实上,科学家称这些为分割图。听起来好多了,但仍然很难看。
每个人都可以实现照片写实主义
虽然我们听到 Bryan Catanzaro 相对难以置信地宣布,该应用程序允许您为 18 个月以下的儿童根据着色书上的图画创建照片,但我们看到他的助手正在选择画笔,然后选择单词“云”。然后,他在左侧图像中快速绘制了一个形状,然后选择填充工具并填充可能是生病的海牛或飞翔的粪便的东西。在左边,形状变得白色、扁平和丑陋,而在右边,突然出现一朵云,这会让最挑剔的空想主义者梦寐以求。
在路上,刘明宇在左边画了一棵树,从调色板中选择树,显然,在右边,出现了一棵相当漂亮的苹果树,以法国风格切割。它也可能是倒立,从远处很难辨别。
然后我们开始摸不着头脑,当科学设计师画出一个池塘时,我们突然停下来,天空和我们的木瓜树立即倒映在池塘里。
为了让大家明白这一点,布莱恩·卡坦扎罗要求他的队友在地上撒雪。魔法!不仅地面变白,形状更加柔和、模糊,连树……也失去了叶子。
“我们训练了我们的神经网络,使其能够生成与语义调色板中选择的单词相对应的像素和纹理,并了解各种物体或自然元素应该是什么样子。”,应用深度学习副总裁微笑着,对其效果感到自豪,“但我们也确保他了解这些不同元素之间的联系。因此,水面自然地反映了它的环境,而树在秋天或冬天会失去叶子。 »
显然,这一切都不需要设计师去干预或绞尽脑汁。
给人留下深刻印象的网络
两位科学家将他们的项目命名为 GauGAN,这是一个混合词,将高更 (Gauguin) 和然而, 倒生成对抗网络, 的演变深度学习它允许智能通过对抗另一个人工智能的知识来“创造”。结果是相当令人难以置信的。实时地,在我们眼前,山脉、透明的海洋或不透明的池塘诞生了,除了一些细节之外,很难知道我们面对的不是真正的陈词滥调。
更好的是,这两位研究人员向我们保证,这一杰作背后所发挥的数学之美将确保随机渲染所创建的每棵树、每一个天空的刷子、每一个海滩的草图......无限的环境展现在我们面前。
当我们等待克服这个困难时,Bryan Catanzaro 向我们解释说他的小演示在 RTX 2080 Ti 上运行。他认为,你需要一个强大的 GPU 来进行实时渲染,并具有强大的张量核心。但更有限的演示可以在简单的 CPU 或更普通的图形芯片上运行......
因此,布莱恩·卡坦扎罗(Bryan Catanzaro)无疑是为了取悦比尔·达利(Bill Dally),他解释说,有很多方法可以将他的程序集成到建筑师的图形创建工具中。他甚至看到了视频游戏创作的光明前景,让环境更加真实、反应灵敏。但我们知道布莱恩这样做只是为了取悦我们。他只是希望我们能够在 GauGAN 上线后,用他的 GauGAN 来绘制逼真的土豆头先生。人工智能游乐场,Nvidia 网站的一部分,该公司邀请我们使用其人工智能驱动的工具。