← 返回 JSSC 论文列表
📄 下载 JSSC 原文 PDF
JSSC 2023第1期Memory65nm

A Systolic Neural CPU Processor Combining Deep Learning and General-Purpose Comp

提出一种结合深度学习与通用计算的脉动神经网络CPU处理器,提升机器学习任务性能。
65nm, 1.8TOPs/W, 95% PE利用率
神经网络加速器RISC-V脉动阵列深度学习通用计算
创新点1:脉动神经网络CPU处理器架构(系统创新) - 提出了一种新型的Systolic Neural CPU Processor (SNCPU)架构,将深度学习加速器和通用计算CPU核心深度融合,通过64%-80%处理单元(PE)逻辑复用和仅10%面积开销,实现了10个RISC-V CPU核心的可配置能力。
创新点2:双向数据流设计(方法创新) - 开发了独特的双向数据流机制,有效消除了传统异构架构中CPU与DNN加速器之间的昂贵数据传输,在65nm测试芯片上实现了1.8TOPs/W的能效比。
创新点3:四种工作模式提升DNN加速器利用率(系统创新) - 设计了四种灵活的工作模式,通过动态资源配置使DNN加速器利用率超过95%,在ImageNet等数据集上实现39%-64%的端到端性能提升。
创新点4:高能效设计(电路创新) - 通过创新的PE阵列设计和数据通路优化,在保持通用计算能力的同时实现了神经网络计算的高能效,测试芯片验证了其能效优势。
Abstract
While neural network (NN) accelerators are being significantly developed in recent years, CPU is still essential for data management and pre-/post-processing of accelerators in a commonly used heterogeneous architecture, which usually contains an NN accelerator and a processor core with data transfer performed by direct memory access (DMA) engine. This work presents a special neural processor, referred to as a systolic neural CPU processor (SNCPU), which is a unified architecture combining deep le