• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

于娟 (于娟.) [1] (Scholars:于娟) | 吴晓鹏 (吴晓鹏.) [2] | 廖晓 (廖晓.) [3] | 刘建国 (刘建国.) [4]

Indexed by:

EI PKU CSCD

Abstract:

法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性.该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库.该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合.实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用.

Keyword:

FP序列树 成词度 文本压缩 法语文本挖掘 词语提取

Community:

  • [ 1 ] [于娟]福州大学
  • [ 2 ] [吴晓鹏]福州大学
  • [ 3 ] [廖晓]广东金融学院
  • [ 4 ] [刘建国]上海财经大学

Reprint 's Address:

Email:

Show more details

Version:

Related Keywords:

Source :

电子科技大学学报

ISSN: 1001-0548

CN: 51-1207/TN

Year: 2021

Issue: 1

Volume: 50

Page: 84-90

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 2

Online/Total:104/10044348
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1