bs4数据解析基础



import requests
from bs4 import BeautifulSoup

if __name__ == "__main__":
    # headers = {
    #     'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    # }   # UA伪装

    fp = open('./text.html','r',encoding='utf-8')
    soup = BeautifulSoup(fp,'lxml') #将本地的html文档中的数据加载到该对象中
    # print(soup)
    # print(soup.input['href']) # soup.tagName 返回的是html文件第一次出现的tagname对应的标签
    # print(soup.find('div')) # 等同于 soup.div
    # print(soup.find('div',class_ = 'hzbtabs')) # 属性定位
    # print(soup.find_all("div"))
    # print(soup.select(".hzbtabs"))
    # print(soup.select('.hzbbannertxt >a')[0]['href'])

相关阅读:
MISC | ctfshow 31
010editor 没有分块高亮显示了
BUUCTF | [网鼎杯 2020 朱雀组]phpweb
python2与python3共存后，如何使用
kali2020 装不上docker
php代码审计整理
[MRCTF2020]Ezpop
kali没有tcptraceroute如何安装
[BUUCTF] 真的很杂
【弱网测试】备份弱网测试相关数据

原文地址：https://www.cnblogs.com/huahuawang/p/12692333.html