结合动态自适应调制和结构关系学习的细粒度图像分类 - Details

author：

王衍根 (王衍根.) ^[1] | 陈飞 (陈飞.) ^[2] (Scholars：陈飞) | 陈权 (陈权.) ^[3]

Abstract：

由于细粒度图像类间差异小,类内差异大的特点,因此细粒度图像分类任务关键在于寻找类别间细微差异.最近,基于Vision　Transformer的网络大多侧重挖掘图像最显著判别区域特征.这存在两个问题:首先,网络忽略从其他判别区域挖掘分类线索,容易混淆相似类别;其次,忽略了图像的结构关系,导致提取的类别特征不准确.为解决上述问题,本文提出动态自适应调制和结构关系学习两个模块,通过动态自适应调制模块迫使网络寻找多个判别区域,再利用结构关系学习模块构建判别区域间结构关系;最后利用图卷积网络融合语义信息和结构信息得出预测分类结果.所提出的方法在CUB-200-2011　数据集和NA-Birds数据集上测试准确率分别达到　92.9%和　93.0%,优于现有最先进网络.

Keyword：

Vision Transformer(ViT) 动态自适应调制图卷积网络细粒度图像分类结构关系学习

Community：

[ 1 ] [陈飞]福州大学计算机与大数据学院,福州 350108
[ 2 ] [王衍根]福州大学计算机与大数据学院,福州 350108
[ 3 ] [陈权]福州大学计算机与大数据学院,福州 350108

Reprint 's Address：

Email：

Show more details

Version：

结合动态自适应调制和结构关系学习的细粒度图像分类
2024，计算机系统应用

Related Keywords：

Source ：

计算机系统应用

ISSN： 1003-3254

Year： 2024

Issue： 8

Volume： 33

Page： 166-175

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 5

Affiliated Colleges：

计算机与大数据学院、软件学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search WF WF WF WF WF WF WF

Type
Departments

All Years Choose Year From to