Home>Results

  • Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

[期刊论文]

基于FP序列树的法文词语提取方法研究

Share
Edit Delete 报错

author:

于娟 (于娟.) [1] (Scholars:于娟) | 吴晓鹏 (吴晓鹏.) [2] | 廖晓 (廖晓.) [3] | Unfold

Indexed by:

CQVIP PKU CSCD

Abstract:

法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合。实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用。

Keyword:

FP序列树 成词度 文本压缩 法语文本挖掘 词语提取

Community:

  • [ 1 ] 福州大学经济与管理学院
  • [ 2 ] 广东金融学院互联网金融与信息工程学院
  • [ 3 ] 上海财经大学会计与财务研究院

Reprint 's Address:

Show more details

Version:

Source :

电子科技大学学报

ISSN: 1001-0548

CN: 51-1207/TN

Year: 2021

Issue: 01

Volume: 50

Page: 84-90

Cited Count:

WoS CC Cited Count: 0

30 Days PV: 0

Online/Total:201/10267940
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1