基于特征词配对的德语文本聚类方法研究 - Details

初始密码提示：姓名拼音首字母【第一个汉字的首字母大写，其他首字母小写】+身份证号（或护照）后六位【包含字母的，字母大写】

手机验证码登录找回密码

author：

简梓炜 (简梓炜.) ^[1] | 于娟 (于娟.) ^[2] (Scholars：于娟)

Abstract：

[目的/意义]提出一种适用于德语文本处理的文本相似度计算方法，填补了国内外德语文本聚类研究的空缺。[方法/过程]通过词语提取和特征词选择将每个德语文本表示为一个特征词的集合，寻找集合间配对的特征词对，由特征词对的匹配度得到文本间的相似度。[结果/结论]基于多个德语数据集的实验结果表明，相比于已有方法，本文提出的基于特征词配对的德语文本聚类方法提升了约5%的NMI值和约6%的Purity值。基于特征词配对的相似度计算方法能够保留更多的文本信息，从而进一步提升德语文本聚类的性能。

Keyword：

德语文本相似度文本聚类特征词

Community：

[ 1 ] 福州大学经济与管理学院

Reprint 's Address：

Email：

Show more details

Related Keywords：

Source ：

情报探索

ISSN： 1005-8095

CN： 35-1148/N

Year： 2022

Issue： 09

Volume： 8

Page： 86-93

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 2

Affiliated Colleges：

经济与管理学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search CNKI CNKI CNKI

Type
Departments

All Years Choose Year From to