python相关知识

今天学习了python爬虫相关的知识，有了一定的了解

网络格式：1.json格式
2.bs4.BeautifulSoup() 提取数据自动纠正html出错（有限）
函数的参数
解析器：1 lxml解析器基于C语言开发的解析速度快，但是需要额外安装，适用于大量的数据进行解析
2 html.parser BeautifulSoup内置的解析器，不需要安装
遍历文档树搜索文档树（通过制定的标签名，属性名（唯一的）来寻找节点）
3.html子节点兄弟节点

4.正则表达式：
findall函数：用于查找字符串中所有符合正则表达式的字符串，返回一个列表
例：
import re
python='python2 python3 are all python'
print(re.findall('python',python))

输出：['python', 'python', 'python']
5.http:超文本传输线协议
https:安全超文本传输协议数据加密

相关阅读:
python cookbook 笔记二
python cookbook 笔记一
aircrack-ng笔记
TeamCity 和 Nexus 的使用
Linux 搭建 nexus 私服【转】
maven阿里云镜像
kali linux 破解wpa密码
python正则表达式二[转]
Java并发编程：Synchronized底层优化（偏向锁、轻量级锁）
集合解析

原文地址：https://www.cnblogs.com/zhang12345/p/12270216.html