• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

于娟 (于娟.) [1] (Scholars:于娟) | 张晨 (张晨.) [2]

Indexed by:

PKU CSCD

Abstract:

跨语言术语对齐是跨语言文本数据分析与知识发现的关键基础.针对跨语言术语对齐研究多为单词术语对齐且严重依赖向量空间对齐的现状,提出一种能够实现跨语言单词及多词术语间一对多对齐的Kernel-XGBoost方法.给定跨语言平行语料库,该方法分两步得到同义的跨语言术语对:1)跨语言术语提取与候选术语对生成;2)基于跨语言词嵌入的术语对齐.汉语-西班牙语以及汉语-法语的术语对齐实验表明,该方法在Top-5的准确率可达到80%,能有效支持跨语言信息检索、本体构建等跨语言文本数据挖掘任务.

Keyword:

Kernel-XGBoost 文本分析 术语对齐 汉语 法语 西班牙语 跨语言

Community:

  • [ 1 ] [张晨]福州大学
  • [ 2 ] [于娟]福州大学

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

计算机科学

ISSN: 1002-137X

CN: 50-1075/TP

Year: 2022

Issue: z2

Volume: 49

Page: 114-119

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 3

Online/Total:87/10022331
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1