随着摩尔定律的衰落,半导体行业不断寻找替代方法来提高性能。目前,这种增益主要是通过芯片上计算核心的倍增来获得。但还有其他可能性,例如缓存优化。麻省理工学院的三名研究人员刚刚提出《叠叠乐》一种缓存管理方法,可以将计算速度提高20%至30%,同时降低能耗30%至85%。这是相当可观的。
为了理解它是如何工作的,有必要做一些提醒。在处理器中,高速缓存按层次结构分为几个级别(L1、L2、L3、L4),从最快和最小到最慢和最大。在多核架构中,每个核心都有L1和L2缓存,只有它可以使用。它还具有直接邻近的 L2 高速缓存,与其他内核共享。最后,L3是位于芯片外部的共享内存池。 L1、L2和L3通常是SRAM,L4而不是DRAM。
这种层次结构非常实用,因为它通过分配数据访问的优先级来优化芯片的操作。处理器必须快速且永久访问的数据存储在 L1 或 L2 中。那些不太重要的位于 L3 和 L4。但研究人员 Po-An Tsai、Nathan Beckmann 和 Daniel Sanchez 认为,最后两个级别的管理过于严格,没有充分考虑应用的特殊性。
由于数据结构的大小,它可能分布在 L3 和 L4 上,这迫使处理器系统地询问这两个存储器以找到所需的数据。将所有内容都放在 L4 中可能会更好。当然,访问时间会更长,但会更少,总体上我们会有所收获。
每 100 毫秒重新配置一次
因此,Jenga 的想法是根据每个应用程序的需求,从 L3 和 L4 内存创建虚拟缓存级别。有时只有一个虚拟级别,由 L3 或 L4 或两者的组合组成。有时会有两个虚拟级别,由 L3 或 L4 或两者的组合组成。只要性能普遍提高,一切皆有可能。资源分配是通过相当复杂的算法执行的,该算法每……100 毫秒计算一次最佳内存配置。厨房对应用程序保持完全透明。
研究人员制作了基于 36 核芯片的技术原型,该芯片具有 512 KB L3 SRAM 缓存和 4 x 256 MB L3 DRAM 缓存。他们将 Jenga 实现为操作系统级别的永久进程。然后他们在大约二十个应用程序上对其进行了测试。结果显然有很大不同。有时 Jenga 什么都不做,但通常由于内存访问次数的减少,芯片的性能得到提高。这一结果肯定会影响未来的处理器架构。
来源: 和,科学论文