Nvidia 推出 Tesla V100,這是首款採用 Volta 晶片的專業顯示卡,專為人工智慧和深度學習而設計。 2018 年之前尚未計劃推出適用於普通公共 PC 的版本,但前景誘人。
在GTC大會(GPU技術大會)上,Nvidia終於推出了首款基於其全新架構Volta的顯示卡。不過,目前它將保留給非常專業的 Tesla V100,並且只能用於售價在 70,000 美元到 150,000 美元之間的大型伺服器或工作站。

Tesla V100:IA、深度學習與雲端運算
首先,Tesla V100 是有史以來生產的最大晶片之一,英偉達為此花費了略高於 30 億美元的研發費用。以12奈米刻製的晶片在815平方毫米的表面積上包含210億個電晶體。相比之下,其前身 P100 在 610 mm2 晶片上「僅」擁有 153 億個電晶體…
降低雕刻的精細度並增加晶片的尺寸使英偉達能夠顯示一系列數字,每一個都比上一個更令人印象深刻。
因此,在這款V100 中,有5120 個Cuda 核心,由16 GB HBM2 記憶體(頻寬為900 GB/秒,介面為4096 位元)支持,圖形運算能力介於7.5(雙精度FP64)和15 TFLOPS(單精度)之間。提醒一下,泰坦Xp- 現今最高階的消費卡 - 提供 12 TFLOPS 的運算能力。
當然,可以結合多個 V100 的功能,並利用這一點,Nvidia 提供了新版本的介面 (NVLink),讓 GPU 之間以及 GPU 與 CPU 之間的對話數量增加一倍。在深度學習應用中如此重要的記憶體存取問題仍然沒有得到解答。

據其創造者稱,基於 Pascal 架構(例如 GTX 1080),TV100 的性能將比當前 Tesla 同類產品好 5 倍,並且能夠提供 100 個高端計算機處理器的計算能力。一根稻草!
心係人工智慧
證明 Tesla V100 與我們的遊戲 PC 無關,該晶片還包括一個新功能,Tensor Cores (640),專門用於執行神經網路來訓練人工智慧的計算單元。
顯然,V100 旨在以最佳方式運行支援深度學習的不同平台,包括 TensorFlow、MXnet 和 Caffe2。這些超專業的張量核心可以更快地處理特定於深度學習的演算法層。換句話說,他們更快地處理學習人工智慧的每一步。由於 Nvidia 在支援的框架方面是不可知的,因此這種收益可以在醫療領域以及研究、高級工程甚至自動運輸領域獲得。
在執行與深度學習相關的計算時,Tensor Core 和 Cuda Core 的累積功率將達到 120 TFLOPS(混合精度 FP16I 和 FP32)。
亞馬遜、Facebook、百度、微軟甚至谷歌顯然都對這種超強大的運算解決方案感興趣。在 Nvidia 老闆 Jensen Huang 的開幕主題演講中,傑夫貝佐斯 (Jeff Bezos) 公司和雷蒙德巨頭的代表上台宣誓效忠這個解決方案。
但那些沒有資格成為聚光燈的人卻在聖荷西會議中心的走廊上無所不在,證明了英偉達確實處於人工智慧革命的核心地位。
我們很容易理解高科技和網路巨頭的這種熱情。據 Jensen Huang 稱,Nvidia 的一台 DGX-1V 伺服器(售價 15 萬美元)配備了 8 個 Tesla V100 晶片,能夠取代 400 台現有伺服器。基礎設施和能源方面的節省將是巨大的。特別是因為該伺服器能夠提供運算能力,使得在 8 台 Titan X 上需要 8 天的操作在相同數量的 Tesla V100 上只需要 8 小時。
在人工智慧這樣一個競爭激烈、時間和人力都短缺的領域,爭論相當大。因此,特斯拉V100的未來很可能是光明的。
離我們更近
如果說人工智慧革命顯然對我們的日常生活產生了直接影響,那麼這一切仍然相當遙遠,有時甚至是模糊的。但在如此強大的力量背後,我們絕不能忘記我們正在為遊戲電腦的未來做好準備。
如果 Nvidia 遵循其一貫的節奏,Volta 應該不會在明年之前到達我們的塔樓(最多)。有一點是肯定的,該晶片未來的 GeForce GTX 版本也可能非常可怕。