基于可分离结构变换的轻量级Vision Transformer - Details

author：

黄延辉 (黄延辉.) ^[1] | 兰海 (兰海.) ^[2] | 魏宪 (魏宪.) ^[3]

Abstract：

由于视觉Transformer结构模型参数量大、浮点计算次数高，使得其难以部署到终端设备上。因为注意力矩阵存在低秩瓶颈，所以模型压缩算法和注意力机制加速算法不能很好地平衡模型参数量、模型推理速度和模型性能之间的关系。为了解决上述问题，本文设计一种轻量级的Vi　T-SST模型用于图像分类任务。首先，通过将传统全连接层转换为可分离结构，大幅度降低模型参数量且提高了模型推理速度，保证了注意力矩阵不会因出现低秩而破坏模型表达能力;其次，提出一种基于SVD分解的克罗内克积近似分解法，可以将公开的Vi　T-Base模型预训练参数转换至Vi　T-Base-SST模型，略微缓解了Vi　T模型的过拟合现象并提高...

Keyword：

图像分类模型压缩深度学习计算机视觉

Community：

[ 1 ] 福州大学电气工程与自动化学院
[ 2 ] 中国科学院福建物质结构研究所泉州装备制造研究中心

Reprint 's Address：

Email：

Show more details

Related Keywords：

基于可分离结构变换的轻量级Vision Transformer
2022，计算机与现代化
基于DeepLabv3的随机褶皱防伪图案识别研究
2021，信息技术与网络安全
基于生成式自监督学习的对抗样本分类算法
2024，微电子学与计算机
基于迁移学习和SVM的糖网图像分类
2018，信息通信
人工智能时代下计算机视觉技术发展探索
2024，数码设计

Source ：

计算机与现代化

ISSN： 1006-2475

CN： 36-1137/TP

Year： 2022

Issue： 10

Volume： 7

Page： 75-81

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 0

Affiliated Colleges：

电气工程与自动化学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search CNKI CNKI CNKI

Type
Departments

All Years Choose Year From to