爬虫常用相关库 - 润新知

爬虫常用相关库

1.爬取数据的库和框架：urllib2和urllib, urllib3, requests, 框架：scrapy 和分布式爬取库 scrapy-redis

2.解析html数据的：正则， xpath(语言) BeautifulSoup4

3.解析json数据的库：JsonPath

4.json通用提取数据方式是：先转换成python中字典，根据key取值，json库

5.数据分析的库：numpy, pandas

6.可视化的库：Matplotlib

7.数据存储：文件，mysql, mongodb, redis

注意：urllib2在python3中被改为 urllib.request ; python解释器自带urllib和urllib2 这两个库；
相关阅读:
mariadb 数据库集群配置
 mariadb 4
mariadb 3
mariadb 2
mariadb 1
firewalld 防火墙
 k8s集群搭建
 k8s控制器资源
 k8s Ingress和ingress控制器
 k8s service对象
原文地址：https://www.cnblogs.com/guo-s/p/13954205.html

Copyright © 2020-2023 润新知