Indexed by:
Abstract:
深度神经网络(Deep Neural Network,DNN)中数据量巨大,且卷积层计算复杂度高,使得其难以在资源有限的嵌入式GPU上进行部署,因此需要对其进行并行加速设计.本文提出采用切比雪夫多项式对卷积核进行逼近,并将该优化方案应用在面向图像重构的DNN中以实现卷积操作的并行化处理,降低计算复杂度.然后为优化后的网络卷积层进行基于GPU的并行加速设计,最后将网络整体移植到NVIDIA AGX Xavier嵌入式开发板上来实现图像的重构推理过程.实验结果表明,并行加速后的网络重构推理的速度是原始网络的2.2倍.
Keyword:
Reprint 's Address:
Email:
Version:
Source :
小型微型计算机系统
ISSN: 1000-1220
CN: 21-1106/TP
Year: 2020
Issue: 10
Volume: 41
Page: 2206-2211
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: -1
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: