• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

李帅 (李帅.) [1] | 于娟 (于娟.) [2] | 巫邵诚 (巫邵诚.) [3]

Indexed by:

PKU CSCD

Abstract:

跨语言文本主题发现是跨语言文本挖掘领域的重要研究方向,对跨语言文本分析和组织各种文本数据具有较高的应用价值.基于Bagging和跨语言词嵌入改进LDA主题模型,提出跨语言文本主题发现方法BCL-LDA(Bagging,Cross-lingual word embedding with LDA),从多语言文本中挖掘关键信息.该方法首先将Bagging集成学习思想与LDA主题模型结合生成混合语言子主题集;然后利用跨语言词嵌入和K-means算法对混合子主题进行聚类分组;最后使用TF-IDF算法对主题词进行过滤排序.汉语-德语、汉语-法语主题发现实验表明,该方法在主题连贯性和多样性方面均表现优异,能够提取出语义更加相关且主题更加连贯多样的双语主题.

Keyword:

LDA 主题发现 主题聚类 德语 法语 跨语言

Community:

  • [ 1 ] [李帅]福州大学
  • [ 2 ] [于娟]福州大学
  • [ 3 ] [巫邵诚]福州大学

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

计算机科学

ISSN: 1002-137X

Year: 2024

Issue: z1

Volume: 51

Page: 182-189

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 3

Affiliated Colleges:

Online/Total:115/9985607
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1