Home>Results

  • Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

[期刊论文]

文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法

Share
Edit Delete 报错

author:

陈可嘉 (陈可嘉.) [1] (Scholars:陈可嘉) | 刘惠 (刘惠.) [2]

Indexed by:

PKU

Abstract:

针对文本分类中文本数据表示存在稀疏性、维度灾难、语义丢失的问题,提出一种基于单词表示的全局向量(global vectors for word representation,GloVe)模型和隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型的文本表示改进方法.利用GloVe模型结合局部信息和全局词语共现的统计信息训练得到文本的稠密词向量,基于LDA主题模型生成文本隐含主题和相应的概率分布,构建文本向量以及基于概率信息的主题向量,并计算两者之间的相似性作为分类器的输入.实验结果表明,相比其他几种文本表示方法,改进方法在精确率、召回率和F1值上均有所提高,基于GloVe和LDA的文本表示改进方法能有效提升文本分类器的性能.

Community:

  • [ 1 ] [陈可嘉]福州大学经济与管理学院,福州350116
  • [ 2 ] [刘惠]福州大学经济与管理学院,福州350116

Reprint 's Address:

Show more details

Source :

科学技术与工程

ISSN: 1671-1815

CN: 11-4688/T

Year: 2021

Issue: 29

Volume: 21

Page: 12631-12637

Cited Count:

WoS CC Cited Count: 0

30 Days PV: 3

查看更多>>操作日志

管理员  2025-04-11 01:17:08  更新被引

管理员  2024-01-31 23:56:23  更新被引

管理员  2022-03-31 15:24:09  追加

管理员  2021-12-27 10:55:13  追加

Online/Total:76/10273309
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1