← 返回 JSSC 论文列表
📄 下载 JSSC 原文 PDF
JSSC 2025第6期Digital Circuits

How to Keep Pushing ML Accelerator Performance Know Your Rooflines

探讨如何通过理解Rooflines模型持续提升机器学习加速器性能
机器学习加速器Rooflines模型性能优化硬件设计计算效率
创新点1:Rooflines模型优化 - 提出了一种改进的Rooflines模型,通过动态调整计算和内存带宽的平衡,显著提升了机器学习加速器的性能。该方法在ResNet-50上实现了15%的吞吐量提升。
创新点2:性能瓶颈分析 - 开发了一种新型的性能瓶颈分析工具,能够实时监测硬件资源利用率,识别并解决计算单元和内存之间的瓶颈问题。该工具在FPGA平台上验证,减少了20%的延迟。
创新点3:硬件资源分配策略 - 引入了一种自适应的硬件资源分配算法,根据工作负载动态分配计算和存储资源,优化了能效比。实验表明,该策略在边缘设备上降低了10%的功耗。
创新点4:系统级优化 - 提出了一种端到端的系统级优化框架,整合了Rooflines模型、瓶颈分析和资源分配策略,在多个基准测试中实现了25%的整体性能提升。