Indexed by:
Abstract:
基于CPU及GPU的卷积神经网络平台存在体积大、能耗高等问题,提出了一种基于Zynq平台的卷积神经网络人脸检测加速系统.该系统采用YOLOv3-Tiny算法,并利用Wider Face人脸数据集进行训练.为提高网络效率,采用层融合技术减小网络深度,加快检测速度;同时,采用8位整数量化策略,以降低内存访问量,减少资源消耗.通过利用ZynqXC7Z035芯片上FPGA端并行计算能力,设计出可重复利用的多通道卷积计算模块,实现DSP的重复递用.实验结果显示,所设计的加速系统实现了 9.5 FPS的实时推理速度,检测速度是intel i7-8700CPU的7.9倍,系统功耗仅为2.65 W,满足低功耗的性能需求.
Keyword:
Reprint 's Address:
Version:
Source :
半导体光电
ISSN: 1001-5868
Year: 2024
Issue: 3
Volume: 45
Page: 469-476
Affiliated Colleges: