• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

王晓莉 (王晓莉.) [1] | 叶东毅 (叶东毅.) [2] (Scholars:叶东毅)

Indexed by:

Scopus CQVIP PKU CSCD

Abstract:

社交媒体文本中突出的长尾效应和过量的词典外词汇(OOV)导致严重的特征稀疏问题,影响分类模型的准确率.针对此问题,文中提出基于字词特征自注意力学习的社交媒体文本分类方法.在字级别构建全局特征,用于学习文本中各词的注意力权值分布.改进现有的多头注意力机制,降低参数规模和计算复杂度.为了更好地分析字词特征融合的作用,提出OOV词汇敏感度,用于衡量不同类型的特征受OOV词汇的影响.多组社交媒体文本分类任务的实验表明,文中方法在融合字特征和词特征方面的有效性与分类准确度均有较明显的提升.此外,OOV词汇敏感度指标的量化结果验证文中方法是可行有效的.

Keyword:

字词特征融合, 社交媒体文本分类, 自注意力机制, 词典外词汇敏感度

Community:

  • [ 1 ] [王晓莉]福州大学
  • [ 2 ] [叶东毅]福州大学

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

模式识别与人工智能

ISSN: 1003-6059

CN: 34-1089/TP

Year: 2020

Issue: 4

Volume: 33

Page: 287-294

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 1

Online/Total:86/10068593
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1