隨著摩爾定律的衰落,半導體產業不斷尋找替代方法來提高性能。目前,這種增益主要是透過晶片上計算核心的倍增來獲得。但還有其他可能性,例如快取優化。麻省理工學院的三位研究人員剛提出《疊疊樂》一種快取管理方法,可以將運算速度提高20%至30%,同時降低能耗30%至85%。這是相當可觀的。
為了理解它是如何運作的,有必要做一些提醒。在處理器中,快取依層次結構分為幾個等級(L1、L2、L3、L4),從最快和最小到最慢和最大。在多核心架構中,每個核心都有L1和L2緩存,只有它可以使用。它還具有直接鄰近的 L2 高速緩存,與其他核心共享。最後,L3是位於晶片外部的共享記憶體池。 L1、L2和L3通常是SRAM,L4而不是DRAM。

這種層次結構非常實用,因為它透過分配資料存取的優先權來優化晶片的操作。處理器必須快速且永久存取的資料儲存在 L1 或 L2 中。那些不太重要的位於 L3 和 L4。但研究人員 Po-An Tsai、Nathan Beckmann 和 Daniel Sanchez 認為,最後兩個層級的管理過於嚴格,沒有充分考慮應用的特殊性。
由於資料結構的大小,它可能分佈在 L3 和 L4 上,這迫使處理器系統地詢問這兩個記憶體以找到所需的資料。將所有內容都放在 L4 中可能會更好。當然,訪問時間會更長,但會更少,總體上我們會有所收穫。
每 100 毫秒重新配置一次
因此,Jenga 的想法是根據每個應用程式的需求,從 L3 和 L4 記憶體創建虛擬快取等級。有時只有一個虛擬級別,由 L3 或 L4 或兩者的組合組成。有時會有兩個虛擬級別,由 L3 或 L4 或兩者的組合組成。只要性能普遍提高,一切都有可能。資源分配是透過相當複雜的演算法執行的,該演算法每…100 毫秒計算一次最佳記憶體配置。廚房對應用程式保持完全透明。

研究人員製作了基於 36 核心晶片的技術原型,該晶片具有 512 KB L3 SRAM 快取和 4 x 256 MB L3 DRAM 快取。他們將 Jenga 實現為作業系統層級的永久進程。然後他們在大約二十個應用程式上對其進行了測試。結果顯然有很大不同。有時 Jenga 什麼都不做,但通常由於記憶體存取次數的減少,晶片的效能得到提高。這一結果肯定會影響未來的處理器架構。
來源: 和,科學論文
🔴為了不錯過任何01net新聞,請關注我們谷歌新聞等WhatsApp。