← 返回 JSSC 论文列表JSSC 2010第11期Digital Circuits90nm
Tera-Scale Performance Machine Learning SoC MLSoC With Dual Stream Processor Arc
一款用于多媒体内容分析的机器学习SoC,采用双流处理器架构实现Tera级性能。
90nm CMOS, 1.7 TOPS/W, 81.3 GOPS/mm²
机器学习系统级芯片多媒体内容分析数字电路硬件架构
▸创新点1:双流处理器架构(DSP)是一种系统创新,通过集成图像流处理器(ISP)和特征流处理器(FSP),实现了计算机视觉和机器学习算法的并行处理,显著提升了处理效率,达到tera-scale性能。
▸创新点2:高带宽双存储器(HBDM)是一种电路创新,通过本地媒体总线实现数据在处理器和存储器之间的高效传输,避免了AMBA AHB带宽的消耗,从而提高了数据吞吐量和系统整体性能。
▸创新点3:计算机视觉与机器学习算法协同加速是一种方法创新,通过优化算法和硬件架构的结合,实现了1.7 TOPS/W的能效比和81.3 GOPS/mm²/50的面积效率,显著提升了多媒体内容分析的实时性。
▸创新点4:本地媒体总线的设计是一种电路创新,通过优化数据传输路径,减少了传统总线架构的延迟和功耗,进一步提升了系统的能效比和性能。
Abstract
se-Wei Chen, Chi-Sun Tang, Sung-Fang Tsai, Chen-Han Tsai, Shao-Yi Chien , Member , IEEE, and
Liang-Gee Chen, Fellow, IEEE
Abstract—A new machine learning SoC (MLSoC) for multi-
media content analysis is implemented with 16-mm/50area in 90-nm
CMOS technology. Different from traditional VLSI architectures,
it focuses on the coacceleration of computer vision and machine
learning algorithms, and two stream processors with massively
parallel processing elements are integrated to achieve tera-scale
pe