MIT工程團隊展示了一種新的AI芯片設計,該設計使神經網絡能夠更快地處理數據。
該團隊在舊金山舉行的國際固態巡迴賽會議上展示了Eyeriss深學習籌碼。它指出,深度學習機制可以提高神經網絡的速度至十倍,並且可以在移動設備上實施這種性能。
麻省理工學院電氣工程助理教授Vivienne Sze說,語音識別,面部檢測和對象識別等應用可以利用深度學習。
Sze解釋說,目前,神經網絡使用高功率圖形處理單元進行操作。將它們帶到移動設備的優勢將大大提高速度。
Sze說:“在手機上處理它也可以避免任何傳輸延遲,因此您可以為某些應用程序做出更快的反應。”她進一步補充說,當地處理可以實施用戶的安全。
但是,團隊如何設法以令人難以置信的速度擠壓?答案是一種不同的處理器設計方法。
Eyeriss Chip的168個內核沒有共享內存,而是收到了自己的離散內存緩存。這避免了在系統周圍移植數據,從而提高了速度。
新的芯片設計還採用了專門製作的電路,可以在發送之前壓縮信息。當數據到達目的地時,會發生減壓,因此數據運輸時間被修剪。
芯片的基本特徵之一是其定制電路。它擴散了負載,從而在最短的時間內通過更多數據進行處理,然後從主存儲店中獲取更多數據。
“ [這項工作表明]深度學習的嵌入式處理器如何提供能力和性能優化”說三星移動處理器創新實驗室高級副總裁Mike Polley。 Polly補充說,這項研究是“從雲到移動設備”帶來複雜計算的第一步。
MIT團隊發表的論文還考慮了應用程序開發人員的需求,因為芯片設計具有行業標準(網絡架構)兼容性。例如,支持Caffe和Alexnet。
在舊金山會議上,麻省理工學院的研究人員展示了Eyeriss如何實現執行圖像認可任務的神經網絡。應該注意的是,這是最先進的神經網絡第一次從事自定義芯片。
但是,麻省理工學院並不是唯一專注於神經網絡研究的機構。
Facebook最近揭示使用神經網絡和模式識別的AI進展。英特爾已經為Amazon的EC2服務提供了自定義芯片,而高通製造了與Google合作的一部分,專門為量身定制的ARM服務器芯片製造。
Nervana系統為中國搜索引擎百度構建定制硬件。
Nervana的聯合創始人之一Amir Khosrowshahi與下一個平台談論了定制的未來。
Khosrowshahi解釋說,深度學習並不需要GPU和CPU所依賴的浮點性能。
他指出,由於大多數運營成本都取決於權力,因此必須優化和定制流程以避免這種情況。
Khosrowshahi指出:“我們選擇的是一個不使用浮點的處理器,這使我們可以選擇更多地計算並節省電源。”