Indexed by:
Abstract:
本发明涉及一种中文微博客的热点话题检测方法,包括以下步骤:(1)首先基于一定的垃圾过滤规则对垃圾微博进行过滤;(2)对分布在微博中的关键字进行初步聚合,得到初步表示话题的词集合;检索各条微博最相似的前k条微博,然后利用检索的结果和关键字初步聚合的结果来丰富各条微博特征,得到各条微博特征丰富后的特征向量;(3)基于各条微博特征丰富后的特征向量,利用增量聚类方法对所有微博进行聚类,得到聚类的话题集合,然后通过一定的话题热度计算公式对聚类的话题集合进行话题热度计算,最终得到热点话题列表。该方法能够高效、准确地对中文微博客进行热点话题检测,检测速度快,准确度高,适用范围广,应用性强。
Keyword:
Reprint 's Address:
Email:
Patent Info :
Type: 发明授权
Patent No.: CN201410034402.3
Filing Date: 2014/1/24
Publication Date: 2017/2/1
Pub. No.: CN103745000B
公开国别: CN
Applicants: 福州大学
Legal Status: 授权
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: