文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法 - Details

author：

陈可嘉 (陈可嘉.) ^[1] (Scholars：陈可嘉) | 刘惠 (刘惠.) ^[2]

Indexed by：

PKU

Abstract：

针对文本分类中文本数据表示存在稀疏性、维度灾难、语义丢失的问题,提出一种基于单词表示的全局向量(global　vectors　for　word　representation,GloVe)模型和隐含狄利克雷分布(latent　Dirichlet　allocation,LDA)主题模型的文本表示改进方法.利用GloVe模型结合局部信息和全局词语共现的统计信息训练得到文本的稠密词向量,基于LDA主题模型生成文本隐含主题和相应的概率分布,构建文本向量以及基于概率信息的主题向量,并计算两者之间的相似性作为分类器的输入.实验结果表明,相比其他几种文本表示方法,改进方法在精确率、召回率和F1值上均有所提高,基于GloVe和LDA的文本表示改进方法能有效提升文本分类器的性能.

Community：

[ 1 ] [陈可嘉]福州大学经济与管理学院,福州350116
[ 2 ] [刘惠]福州大学经济与管理学院,福州350116

Reprint 's Address：

Show more details

Version：

文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法
2021，科学技术与工程
文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法
2021，科学技术与工程

Source ：

科学技术与工程

ISSN： 1671-1815

CN： 11-4688/T

Year： 2021

Issue： 29

Volume： 21

Page： 12631-12637

Cited Count：

WoS CC Cited Count： 0

30 Days PV： 3

Affiliated Colleges：

经济与管理学院本学院/部未明确归属的数据

Get Fulltext

DOI Library Discovery Baidu Scholar Search WF

查看更多>>操作日志

管理员 2025-04-11 01:17:08 更新被引

管理员 2024-01-31 23:56:23 更新被引

管理员 2022-03-31 15:24:09 追加

管理员 2021-12-27 10:55:13 追加

Type
Departments

All Years Choose Year From to