BeautifulSoup的基本使用

一、将一段文档传入BeautifulSoup的构造方法，得到一个文档的对象：

from bs4 import BeautifulSoup
Soup = BeautifulSoup(html_doc)

二、Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment：

三、爬虫主要使用的是CSS选择器这个功能，获取文档中需要的信息部分：

通过标签查找:

Title = Soup.select("title")
#通过tag标签逐层查找
Title = Soup.select("html body title")
#通过某个tag标签下的直接子标签查找
Title = Soup.select("head > title")

通过属性值来查找：

Href = Soup.select('a[href="http://example.com/elise"]')

待人友善是修养，独往独来是性格。 --qq:2986957136

相关阅读:
vue 根据时间时间区间搜索功能
vue 分页
ubuntu18 vscode ros 配置
在ubuntu16上用vscode编译ros历程记录
word:页眉头部出现一条横线
word:设置基偶页不同和页眉页脚
多级标题
添加论文应用
添加论文尾注2（交叉引用）
三线表

原文地址：https://www.cnblogs.com/jxc321/p/7306636.html