• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

于娟 (于娟.) [1] (Scholars:于娟) | 刘强 (刘强.) [2]

Indexed by:

CQVIP PKU CSCD

Abstract:

网络信息资源呈指数级增长,面对用户越来越个性化的需求,主题网络爬虫应运而生.主题网络爬虫是一种下载特定主题网页的程序.利用在采集页面过程获得的特定信息,主题网络爬虫抓取的页面都是与主题相关的.基于主题网络爬虫的搜索引擎以及基于主题网络爬虫构建领域语料库等应用已经得到广泛运用.首先介绍了主题爬虫的定义、工作原理;然后介绍了近年来国内外关于主题爬虫的研究状况,并比较了各种爬行策略及相关算法的优缺点;最后提出了主题网络爬虫未来的研究方向.

Keyword:

主题爬虫 搜索引擎 网络爬虫

Community:

  • [ 1 ] [于娟]福州大学
  • [ 2 ] [刘强]福州大学

Reprint 's Address:

Email:

Show more details

Version:

Related Keywords:

Source :

计算机工程与科学

ISSN: 1007-130X

CN: 43-1258/TP

Year: 2015

Issue: 2

Volume: 37

Page: 231-237

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 0

Online/Total:144/10070414
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1