← 返回 JSSC 论文列表JSSC 2021第6期Memory65nmSRAM
23 CAP-RAM A Charge-Domain In-Memory Computing 6T-SRAM for Accurate and Precisio
CAP-RAM是一种基于电荷域内存计算的6T-SRAM宏,用于高效CNN推理。
573.4 GOPS峰值吞吐量,49.4 TOPS/W能效
内存计算6T-SRAM电荷域CNN推理能效
▸创新点1:电荷域乘累加机制(方法创新) - 采用新型电荷域MAC机制和电路设计,显著提高了在工艺变化下的线性度,相比传统IMC设计具有更优的计算精度和能效表现。该机制通过电荷注入和共享技术实现高精度模拟计算,支持6位权重和8位输入激活的灵活配置。
▸创新点2:半并行架构(系统创新) - 通过共享8个标准6T SRAM单元与一个电荷域MAC电路,高效存储多层CNN的滤波器权重,实现了紧凑的存储结构和高效的数据复用。这种架构显著提升了计算吞吐量,达到573.4 GOPS的峰值性能。
▸创新点3:无采样保持SAR ADC(电路创新) - 采用7位电荷注入SAR ADC(ciSAR)设计,省去了传统采样保持电路和输入/参考缓冲器,大幅降低了功耗和面积开销,同时提升了转换速度和能效,整体能效达到49.4 TOPS/W。
▸创新点4:多级位宽可编程性(方法创新) - 支持多达6级权重位宽和2种编码方案,以及8级输入激活位宽,提供了高度的灵活性和适应性,能够满足不同CNN模型的精度和能效需求,在MNIST和CIFAR-10数据集上分别达到98.8%和89.0%的推理准确率。
Abstract
A compact, accurate, and bitwidth-programmable
in-memory computing (IMC) static random-access memory
(SRAM) macro, named CAP-RAM, is presented for
energy-efficient convolutional neural network (CNN) inference.
It leverages a novel charge-domain multiply-and-accumulate
(MAC) mechanism and circuitry to achieve superior linearity
under process variations compared to conventional IMC designs.
The adopted semi-parallel architecture efficiently stores filters
from multiple CNN layers by sharing eight sta