• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

沈志斌 (沈志斌.) [1] | 白清源 (白清源.) [2] (Scholars:白清源)

Abstract:

随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度和训练样本数对KNN分类效果的影响,并针时这些不足,对KNN算法进行了改进.改进后的方法使训练样本的分布密度趋于均匀,降低了样本数的不均对分类效果的影响,提高了文本分类的准确率。实验结果显示,这种改进后的方法具有很好的性能.

Keyword:

KNN算法 分布密度 加权修正 文本分类 训练样本数 迭代

Community:

  • [ 1 ] [沈志斌]福州大学数学与计算机科学学院 福州 350002
  • [ 2 ] [白清源]福州大学数学与计算机科学学院 福州 350002

Reprint 's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

Year: 2008

Page: 123-126,147

Language: Chinese

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 1

Online/Total:105/9995772
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1