Abstract:
BeautifulSoup库是python语言关于网络爬虫爬取页面解析的第三方库.它能根据html、xml以及html5lib语法建立解析树,进而高效解析网页内容.本文从基本元素、网页内容遍历提取方法入手介绍BeautifulSoup库的工作原理,并结合电商平台最新的图书销售数据为实例,进行爬取信息的解析展示.
Keyword:
Reprint 's Address:
Version:
Source :
福建电脑
ISSN: 1673-2782
CN: 35-1115/TP
Year: 2021
Issue: 5
Volume: 37
Page: 133-134
Affiliated Colleges: