• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

于娟 (于娟.) [1] | 吴晓鹏 (吴晓鹏.) [2] | 廖晓 (廖晓.) [3] | 刘建国 (刘建国.) [4]

Indexed by:

CQVIP PKU CSCD

Abstract:

法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合。实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用。

Keyword:

FP序列树 成词度 文本压缩 法语文本挖掘 词语提取

Community:

  • [ 1 ] 福州大学经济与管理学院,福州350108
  • [ 2 ] 广东金融学院互联网金融与信息工程学院,广州510521
  • [ 3 ] 上海财经大学会计与财务研究院,上海杨浦区200433

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

电子科技大学学报

ISSN: 1001-0548

Year: 2021

Issue: 1

Volume: 50

Page: 84-90

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count: -1

30 Days PV: 0

Affiliated Colleges:

Online/Total:116/10269864
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1