← 返回 JSSC 论文列表JSSC 2013第1期Digital Circuits0.13μm
A 320 mW 342 GOPS Real-Time Dynamic Object Recognition Processor for HD 720p Vid
提出一种异构多核处理器,实现720p高清视频实时动态物体识别,能效提升2.54倍。
342 GOPS峰值性能,320mW平均功耗,30帧/秒处理速度
异构多核实时识别动态物体检测能效优化硬件加速
▸创新点1:上下文感知视觉注意力模型(方法创新)。该模型通过增强注意力精度,显著降低了高清对象识别所需的计算能力,提高了识别效率。
▸创新点2:5级任务级流水线设计(系统创新)。该设计最大化利用了31个异构核心,包括四个同步多线程特征提取集群、一个基于缓存的特征匹配处理器和一个机器学习引擎,实现了实时执行。
▸创新点3:动态资源管理技术(系统创新)。该技术根据检测到的任务量和硬件利用率,自适应调整线程分配和电源管理,提高了能源效率,平均功耗仅为320 mW。
▸创新点4:异构多核处理器架构(电路创新)。该架构结合了多种计算单元,实现了342 GOPS的峰值性能,性能提升2.72倍,每像素能耗降低2.54倍。
Abstract
A heterogeneous multi-cor e processor is proposed to
achieve real-time dynamic object recognition on HD 720p video
streams. The context-aware visual attention model is proposed to
reduce the required computing power for HD object re cognition
based on enhanced attention accuracy. In order to realize real-time
execution of the proposed algorithm, the processor adopts a 5-stage
task-level pipeline that maximizes the utilizat ion of its 31 hetero-
geneous cores, comprising four sim ultaneous multit