Python库-BeautifulSoup

Python库-BeautifulSoup
```
sp = BeautifulSoup.bs4.BeautifulSoup(html.text,"html.parser")
```
方法

1.sp.title

返回网页标题

2.sp.text

返回去除所有HTML标签后的网页内容

3.sp.find(name=None, attrs={}, recursive=True, text=None, **kwargs)

该函数返回值为字符串

第一个参数是标签名字，第二个是个网页属性的字典,例如:
```
<a href = "http://www.baidu.com"
class = "sister" id = "link1">Elsie</a>
sp.find("a",{"id":"link1"})
sp.find("a",{"href":"http://www.baidu.com"})
```
4.sp.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs)

第一个参数可以是多个标签名字构成的列表，例如:
```
sp.find(['a','b'],{"id":"link1"})
```
5.sp.select(selector, _candidate_generator=None, limit=None)

该函数返回值为列表

第一个参数可以是控件id值，要在引号之内加入#，例如：
```
t = m.select("#userAccount")
# 输出 [<input id="userAccount" style="position:absolute; top:7px;" type="text" value=""/>]
```
第一个参数也可以是css类名，例如：
```
<p class ="title"><b>文件标题</b></p>
datal = sp.select(".title")
```
6.get(属性名称)
```
<a href = "http://www.baidu.com"
class = "sister" id = "link1">Elsie</a>
datal = sp.find("a",{"id":"link1"})
print(datal.get("href"))
# 输出 http://www.baidu.com
```
相关阅读:
[CSP-S模拟测试]:集合合并（记忆化搜索）
[CSP-S模拟测试]:小L的数（数位DP+模拟）
[CSP-S模拟测试]:小Y的图（最小生成树+LCA）
[CSP-S模拟测试]:小W的魔术（数学 or 找规律）
[CSP-S模拟测试]:最大值（数学+线段树）
[CSP-S模拟测试]:最小值（DP+乱搞）
[CSP-S模拟测试]:中间值（二分）
[CSP-S模拟测试]:Cover（单调栈++单调队列+DP）
[JZO6401]:Time（贪心+树状数组）
BZOJ3193 [JLOI2013]地形生成【dp】
原文地址：https://www.cnblogs.com/woxiaosade/p/10014134.html