• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

王衍根 (王衍根.) [1] | 陈飞 (陈飞.) [2] (Scholars:陈飞) | 陈权 (陈权.) [3]

Abstract:

由于细粒度图像类间差异小,类内差异大的特点,因此细粒度图像分类任务关键在于寻找类别间细微差异.最近,基于Vision Transformer的网络大多侧重挖掘图像最显著判别区域特征.这存在两个问题:首先,网络忽略从其他判别区域挖掘分类线索,容易混淆相似类别;其次,忽略了图像的结构关系,导致提取的类别特征不准确.为解决上述问题,本文提出动态自适应调制和结构关系学习两个模块,通过动态自适应调制模块迫使网络寻找多个判别区域,再利用结构关系学习模块构建判别区域间结构关系;最后利用图卷积网络融合语义信息和结构信息得出预测分类结果.所提出的方法在CUB-200-2011 数据集和NA-Birds数据集上测试准确率分别达到 92.9%和 93.0%,优于现有最先进网络.

Keyword:

Vision Transformer(ViT) 动态自适应调制 图卷积网络 细粒度图像分类 结构关系学习

Community:

  • [ 1 ] [陈飞]福州大学计算机与大数据学院,福州 350108
  • [ 2 ] [王衍根]福州大学计算机与大数据学院,福州 350108
  • [ 3 ] [陈权]福州大学计算机与大数据学院,福州 350108

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

计算机系统应用

ISSN: 1003-3254

Year: 2024

Issue: 8

Volume: 33

Page: 166-175

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 5

Online/Total:563/10229493
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1