基于语义特征句向量距离的汉语-俄语跨语言文本聚类方法研究 - Details

author：

潘思铭 (潘思铭.) ^[1] | 巫邵诚 (巫邵诚.) ^[2]

Abstract：

[目的/意义]旨在为跨语言文本聚类研究提供参考。[方法/过程]首先，通过分句及计算每个句子的语义特征值确定文档的特征句集并进行文档向量表示；其次，将词旋转距离(Word　Rotator＇s　Distance,WRD)的思路引入相似度计算步骤中，提出语义特征句向量距离(Semantic　Feature　Sentence　Vectors’　Distance,　SFSVD)相似度计算方法，获得不同文档间的相似度；最后，利用HAC聚类算法获得文本聚类的结果。[结果/结论]提出的汉语-俄语跨语言文本聚类方法对比现有方法，其Purity值和NMI值显著提升且表现稳定。基于语义特征句和SFSVD相似度计算方法能够较准确地表示文本信息，从而进一步提升汉语-俄语跨语言文本聚类的性能。

Keyword：

俄语文本相似度文本聚类汉语跨语言

Community：

[ 1 ] 福州大学经济与管理学院

Reprint 's Address：

Show more details

Source ：

情报探索

ISSN： 1005-8095

CN： 35-1148/N

Year： 2023

Issue： 07

Volume： 10

Page： 1-10

Cited Count：

WoS CC Cited Count：

30 Days PV： 1

Affiliated Colleges：

经济与管理学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search CNKI CNKI CNKI CNKI CNKI CNKI CNKI CNKI CNKI CNKI

Type
Departments

All Years Choose Year From to