基于样本密度峰值的不平衡数据欠抽样方法 - Details

初始密码提示：姓名拼音首字母【第一个汉字的首字母大写，其他首字母小写】+身份证号（或护照）后六位【包含字母的，字母大写】

手机验证码登录找回密码

author：

苏俊宁 (苏俊宁.) ^[1] | 叶东毅 (叶东毅.) ^[2]

Indexed by：

PKU CSCD

Abstract：

不平衡数据分类是数据挖掘和机器学习领域的一个重要问题,其中数据重抽样方法是影响分类准确率的一个重要因素。针对现有不平衡数据欠抽样方法不能很好地保持抽样样本与原有样本的分布一致的问题,提出一种基于样本密度峰值的不平衡数据欠抽样方法。首先,应用密度峰值聚类算法估计多数类样本聚成的不同类簇的中心区域和边界区域,进而根据样本所处类簇区域的局部密度和不同密度峰值的分布信息计算样本权重;然后,按照权重大小对多数类样本点进行欠抽样,使所抽取的多数类样本尽可能由类簇中心区域向边界区域逐步减少,在较好地反映原始数据分布的同时又可抑制噪声;最后,将抽取到的多数类样本与所有的少数类样本构成平衡数据集用于分类器的训练...

Keyword：

不平衡数据密度峰值样本权重欠抽样集成学习

Community：

[ 1 ] 福州大学数学与计算机科学学院

Reprint 's Address：

Email：

Show more details

Related Keywords：

Source ：

计算机应用

Year： 2020

Issue： 01

Volume： 40

Page： 83-89

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 4

Affiliated Colleges：

Get Fulltext

Library Discovery Baidu Scholar Search CNKI CNKI

Type
Departments

All Years Choose Year From to