Indexed by:
Abstract:
传统的KNN算法的时间复杂度与训练样本集的数量成正比,大规模数据下其分类效率显著下降,因此它不适用于大规模数据的在线实时处理.为此,本文提出了一种基于类内K-means聚簇的KNN改进算法.该算法先对训练样本集内各个类别的样本分别进行K-means聚簇,得到各个样本所属的簇标签,与各个簇标签所对应的簇中心向量.在进行KNN分类时对于每个测试样本先计算它与各个簇中心向量的相似度,选出排名前的一定个数的簇标签,随后以这些簇所含的样本集作为该测试样本的训练样本集进行传统的KNN分类.改进算法通过这种选择训练样本集而缩小了比对范围,减少了大量计算量.实验表明,改进的KNN分类算法在分类的准确率没有明显变动下,运行效率得到了明显的提升.
Keyword:
Reprint 's Address:
Email:
Version:
Source :
木工机床
ISSN: 1005-1937
CN: 35-1105/TH
Year: 2015
Issue: 4
Page: 20-22,26
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: -1
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: