基于语义特征句向量距离的汉语-俄语跨语言文本聚类方法研究 - Details

初始密码提示：姓名拼音首字母【第一个汉字的首字母大写，其他首字母小写】+身份证号（或护照）后六位【包含字母的，字母大写】

手机验证码登录找回密码

author：

潘思铭 (潘思铭.) ^[1] | 巫邵诚 (巫邵诚.) ^[2]

Abstract：

[目的/意义]旨在为跨语言文本聚类研究提供参考.[方法/过程]首先,通过分句及计算每个句子的语义特征值确定文档的特征句集并进行文档向量表示;其次,将词旋转距离(Word　Rotator　Distance,WRD)的思路引入相似度计算步骤中,提出语义特征句向量距离(Semantic　Feature　Sentence　Vectors＇Distance,SFSVD)相似度计算方法,获得不同文档间的相似度;最后,利用HAC聚类算法获得文本聚类的结果.[结果/结论]提出的汉语-俄语跨语言文本聚类方法对比现有方法,其Purity值和NMI值显著提升且表现稳定.基于语义特征句和SFSVD相似度计算方法能够较准确地表示文本信息,从而进一步提升汉语-俄语跨语言文本聚类的性能.

Keyword：

俄语文本相似度文本聚类汉语跨语言

Community：

[ 1 ] [潘思铭]福州大学
[ 2 ] [巫邵诚]福州大学

Reprint 's Address：

Email：

Show more details

Version：

基于语义特征句向量距离的汉语-俄语跨语言文本聚类方法研究
2023，情报探索
基于语义特征句向量距离的汉语-俄语跨语言文本聚类方法研究
2023，情报探索

Related Keywords：

Source ：

情报探索

ISSN： 1005-8095

Year： 2023

Issue： 7

Page： 1-10

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 3

Affiliated Colleges：

Get Fulltext

Library Discovery Baidu Scholar Search WF WF WF WF WF WF WF WF WF WF WF WF WF WF WF WF

Type
Departments

All Years Choose Year From to