Home>Results

  • Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

[期刊论文]

多策略融合的俄语文本词语提取方法研究

Share
Edit Delete 报错

author:

唐菊香 (唐菊香.) [1] | 孙怿晖 (孙怿晖.) [2] | 廖晓 (廖晓.) [3] | Unfold

Abstract:

俄语是联合国工作语言之一,是俄罗斯等多个国家的官方语言.随着"一带一路"倡议的推进和全球化进程的加快,俄语文本数据成为有关组织管理决策的重要信息来源,俄语文本挖掘也因而成为重要的管理决策支持方法.然而,俄语文本挖掘方法研究目前还远未成熟,尤其是其关键基础——俄语文本词语提取的性能较低,阻碍着俄语文本建模的准确性.因此,文章提出一种多策略融合的俄语文本词语提取方法,结合俄语词性分析、语法规则和串频统计等多种方法,自动提取包含单词和短语在内的俄语词语.在联合国平行语料库和Taiga Corpus语料库上的实验结果表明,文章提出的方法在保证高召回率的同时,达到了85%以上的高准确率,显著优于常用的n-gram方法,能够为俄语文本主题发现和文本分/聚类等文本挖掘应用提供有效的词库.

Community:

  • [ 1 ] [唐菊香]福州大学
  • [ 2 ] [孙怿晖]福州大学
  • [ 3 ] [廖晓]广东金融学院互联网金融与信息工程学院,广东广州 510521
  • [ 4 ] [刘建国]上海财经大学会计与财务研究院,上海 200433
  • [ 5 ] [于娟]福州大学

Reprint 's Address:

Show more details

Source :

中国科技术语

ISSN: 1673-8578

Year: 2021

Issue: 3

Volume: 23

Page: 59-67

Cited Count:

WoS CC Cited Count:

30 Days PV: 2

Affiliated Colleges:

Online/Total:153/10741223
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1