Indexed by:
Abstract:
针对经典CluStream聚类算法的在线微簇聚类过程中限制微簇数量的增长,对微簇进行强制合并,使其在线聚类结果受到影响,导致数据流聚类质量不高,且难以适应海量大数据等问题,提出一种基于时态密度特征的改进CluStream聚类算法.首先,提出微簇时态密度的概念,并用其对微簇进行描述;其次,提出新的微簇删除、合并的机制,能够根据在线微簇的情况动态地添加微簇的数量;最后,应用并行化的框架将算法并行化,以适应海量实时大数据的需求.通过在人工数据集和真实数据集上的对比实验表明,改进后的数据流聚类算法相较于CluStream算法能够得到更高质量的聚类结果.
Keyword:
Reprint 's Address:
Email:
Source :
小型微型计算机系统
ISSN: 1000-1220
CN: 21-1106/TP
Year: 2018
Issue: 1
Volume: 39
Page: 64-68
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count: -1
30 Days PV: 0
Affiliated Colleges: