• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

陈昕杨 (陈昕杨.) [1] | 陈翰泽 (陈翰泽.) [2] | 周嘉晟 (周嘉晟.) [3] | 黄家卿 (黄家卿.) [4] | 余佳硕 (余佳硕.) [5] | 朱龙隆 (朱龙隆.) [6] | 张栋 (张栋.) [7] (Scholars:张栋)

Indexed by:

PKU CSCD

Abstract:

流式数据库在数据库中的占比逐渐增加,在流式数据库的数据流中提取所需信息是一项重要任务。文中研究了数据流的间隔项,并将其应用到了网络场景中。其中间隔项指在数据流中以固定时间间隔到达的元素对,这是第一项在数据流中定义和统计间隔项的工作。为了高效统计间隔项的top-K,提出了IntervalSketch。IntervalSketch首先基于模拟退火对数据流分块以加快统计速度,其次利用Sketch进行间隔项的存储,最后通过特征分组存储策略降低Sketch存储间隔项的空间开销,提升了统计间隔项的精度。IntervalSketch在两个真实数据集上进行了大量对比实验,实验结果表明,在同样内存的情况下,IntervalSketch明显优于基线方案,其中处理时间为基线方案的1/3~1/2,平均绝对误差、平均相对误差约为基线方案的1/3。

Keyword:

Sketch 数据库 数据挖掘

Community:

  • [ 1 ] 福州大学计算机与大数据学院
  • [ 2 ] 泉城省实验室
  • [ 3 ] 福州大学至诚学院

Reprint 's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

计算机科学

ISSN: 1002-137X

CN: 50-1075/TP

Year: 2024

Issue: 04

Volume: 51

Page: 4-10

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 2

Online/Total:180/9977749
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1