基于集成学习的跨语言文本主题发现方法研究 - Details

author：

李帅 (李帅.) ^[1] | 于娟 (于娟.) ^[2] (Scholars：于娟) | 巫邵诚 (巫邵诚.) ^[3]

Indexed by：

PKU CSCD

Abstract：

跨语言文本主题发现是跨语言文本挖掘领域的重要研究方向，对跨语言文本分析和组织各种文本数据具有较高的应用价值。基于Bagging和跨语言词嵌入改进LDA主题模型，提出跨语言文本主题发现方法BCL-LDA(Bagging,　Cross-lingual　word　embedding　with　LDA),从多语言文本中挖掘关键信息。该方法首先将Bagging集成学习思想与LDA主题模型结合生成混合语言子主题集；然后利用跨语言词嵌入和K-means算法对混合子主题进行聚类分组；最后使用TF-IDF算法对主题词进行过滤排序。汉语-德语、汉语-法语主题发现实验表明，该方法在主题连贯性和多样性方面均表现优异，能够提取出语义更加相关且主题更加连贯多样的双语主题。

Keyword：

LDA 主题发现主题聚类德语法语跨语言

Community：

[ 1 ] 福州大学经济与管理学院

Reprint 's Address：

Email：

Show more details

Related Keywords：

基于集成学习的跨语言文本主题发现方法研究
2024，计算机科学
工业4.0时代的中国科技政策热点及政策导向分析
2020，情报探索
A Forensic Analysis Solution of the Email Network Based on Email Contents
2015，12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD)
基于LDA和优化蚁群的OD流向时空语义聚类算法
2022，地球信息科学学报
Evolution of Chinese original-innovation talent policies: a topic modelling approach
2023，TECHNOLOGY ANALYSIS & STRATEGIC MANAGEMENT

Source ：

计算机科学

ISSN： 1002-137X

CN： 50-1075/TP

Year： 2024

Issue： S1

Volume： 51

Page： 194-201

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 5

Affiliated Colleges：

经济与管理学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search CNKI CNKI CNKI CNKI

Type
Departments

All Years Choose Year From to