“為未來播下種子,嘗試登上月球,同時提供具體、適用、有益的東西是很困難的”。這是 Nvidia 研究主管 Bill Dally 在第十屆 GTC 開幕前所說的實質內容。
不要停留在它的介面上
當兩位研究人員上台展示仍處於實驗階段的工具時,我們腦海中仍浮現出這句話。介面類似Windows 3.1下的繪圖軟體。在左側的垂直欄中,三個糟糕的工具等待著人們記住它們的存在,而螢幕的下部則被放置在按鈕上的文字佔據,就像 HTML 4 網站的按鈕一樣優雅。
“海、天、草、雲、水、雪、山、木、礫”, ETC。名單很長。 Nvidia 深度學習應用副總裁 Bryan Catanzaro 表示,這是一個語義調色板,然後讓 Nvidia 研究員 Ming-Yu Liu 開始繪製一系列模糊的塗鴉。它們看起來更像是螢幕左側的極簡主義平坦顏色區域。
然後我們很快就明白了左邊的粗糙形狀和線條在右邊有對應的形狀和線條。事實上,左邊的部分可能是天空的幼稚和幾何版本,然後是有樹木、日落和尖銳山峰的山地景觀。事實上,科學家稱這些為分割圖。聽起來好多了,但還是很難看。
每個人都可以實現照片寫實主義
雖然我們聽到 Bryan Catanzaro 相對難以置信地宣布,該應用程式允許您為 18 個月以下的兒童根據著色書上的圖畫創建照片,但我們看到他的助手正在選擇畫筆,然後選擇單詞“雲” 。然後,他在左側圖像中快速繪製了一個形狀,然後選擇填充工具並填充可能是生病的海牛或飛翔的糞便的東西。在左邊,形狀變得白色、扁平和醜陋,而在右邊,突然出現一朵雲,這會讓最挑剔的空想主義者夢寐以求。
在路上,劉明宇在左邊畫了一棵樹,從調色板中選擇樹,顯然,在右邊,出現了一棵相當漂亮的蘋果樹,以法國風格切割。它也可能是倒立,從遠處很難辨別。
然後我們開始摸不著頭腦,當科學設計師畫出一個池塘時,我們突然停下來,天空和我們的木瓜樹立即倒映在池塘裡。
為了讓大家明白這一點,布萊恩·卡坦扎羅要求他的隊友在地上撒雪。魔法!不僅地面變白,形狀更加柔和、模糊,連樹……也失去了葉子。
“我們訓練了我們的神經網絡,使其能夠生成與語義調色板中選擇的單詞相對應的像素和紋理,並了解各種物體或自然元素應該是什麼樣子。”,應用深度學習副總裁微笑著,對其效果感到自豪,「但我們也確保他了解這些不同元素之間的關聯。因此,水面自然地反映了它的環境,而樹在秋天或冬天會失去葉子。 »
顯然,這一切都不需要設計師去介入或絞盡腦汁。
給人留下深刻印象的網絡
兩位科學家將他們的計畫命名為 GauGAN,這是一個混合詞,將高更 (Gauguin) 和然而, 倒生成對抗網絡, 的演變深度學習它允許智慧透過對抗另一個人工智慧的知識來「創造」。結果是相當令人難以置信的。即時地,在我們眼前,山脈、透明的海洋或不透明的池塘誕生了,除了一些細節之外,很難知道我們面對的不是真正的陳腔濫調。
更好的是,這兩位研究人員向我們保證,這一傑作背後所發揮的數學之美將確保隨機渲染所創建的每棵樹、每一個天空的刷子、每一個海灘的草圖..... .無限的環境展現在我們面前。
當我們等待克服這個困難時,Bryan Catanzaro 向我們解釋說他的小演示在 RTX 2080 Ti 上運行。他認為,你需要一個強大的 GPU 來進行即時渲染,並具有強大的張量核心。但更有限的演示可以在簡單的 CPU 或更普通的圖形晶片上運行...
因此,布萊恩·卡坦扎羅(Bryan Catanzaro)無疑是為了取悅比爾·達利(Bill Dally),他解釋說,有很多方法可以將他的程式整合到建築師的圖形創建工具中。他甚至看到了電玩遊戲創作的光明前景,讓環境更加真實、反應靈敏。但我們知道布萊恩這樣做只是為了取悅我們。他只是希望我們能夠在 GauGAN 上線後,用他的 GauGAN 來繪製逼真的土豆頭先生。人工智慧遊樂場,Nvidia 網站的一部分,該公司邀請我們使用其人工智慧驅動的工具。