Abstract:
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度和训练样本数对KNN分类效果的影响,并针时这些不足,对KNN算法进行了改进.改进后的方法使训练样本的分布密度趋于均匀,降低了样本数的不均对分类效果的影响,提高了文本分类的准确率。实验结果显示,这种改进后的方法具有很好的性能.
Keyword:
Reprint 's Address:
Email:
Version:
Source :
Year: 2008
Page: 123-126,147
Language: Chinese
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: -1
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: