• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

黄畅 (黄畅.) [1] | 郭文忠 (郭文忠.) [2] (Scholars:郭文忠) | 郭昆 (郭昆.) [3] (Scholars:郭昆)

Indexed by:

CQVIP PKU CSCD

Abstract:

针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM).首先,利用词的突发概率进行特征选择,过滤非突发词.其次,结合微博文本的突发特性和传播特性计算微博词对的热值突发概率,将热值突发概率作为BBTM的先验概率.最后,利用基于密度的方法自适应选择BBTM的最优话题数目,确定最优BBTM,实现热点话题发现.在真实微博数据集上的实验表明,H-HBTM可以在不需要预先设定主题数目的情况下,自动发现最优话题模型,并且H-HBTM发现的热点话题的质量高于基于BBTM、词对主题模型以及潜在狄立克雷分配的方法.

Keyword:

主题模型 微博 热点话题发现 突发词对主题模型(BBTM)

Community:

  • [ 1 ] [黄畅]福州大学 数学与计算机科学学院,福州 350116;福州大学 网络计算与智能信息处理重点实验室,福州 350116;.福州大学 空间数据挖掘与信息共享教育部重点实验室,福州 350116
  • [ 2 ] [郭文忠]福州大学 数学与计算机科学学院,福州 350116;福州大学 网络计算与智能信息处理重点实验室,福州 350116;.福州大学 空间数据挖掘与信息共享教育部重点实验室,福州 350116
  • [ 3 ] [郭昆]福州大学 数学与计算机科学学院,福州 350116;福州大学 网络计算与智能信息处理重点实验室,福州 350116;.福州大学 空间数据挖掘与信息共享教育部重点实验室,福州 350116

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

计算机科学与探索

ISSN: 1673-9418

CN: 11-5602/TP

Year: 2019

Issue: 7

Volume: 13

Page: 1103-1114

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 2

Online/Total:94/9985389
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1