Beautiful Soup 解析html表格

from bs4 import BeautifulSoup
import urllib.request
doc = urllib.request.urlopen('http://www.bkzy.org/Index/Declaration?intPageNo=1')
doc = doc.read().decode('utf-8')

soup = BeautifulSoup(doc, "html.parser")

school = 0
pro_code = 1
pro_name = 2
xuewei = 3
pdf = 4


# find_all 查到所有tr列表
for tr in soup.find_all('tr',):
　　# 在每个tr找td
    td = tr.find_all('td')
    try:
        print('%s_%s_%s_%s.pdf' % (
            td[school].text.strip(),
            td[pro_code].text.strip(),
            td[pro_name].text.strip(),
            td[xuewei].text.strip())
            ,td[pdf].find('a')['href'])
    except IndexError as e:
        pass

相关阅读:
Springboot 连接数据库
线程专题 -- 线程的创建，状态，工作过程，常见方法
MySQL中UPDATE语句里SET后使用AND的执行过程和结果分析
SpringCloud | 通过电商业务场景让你彻底明白SpringCloud核心组件的底层原理
避坑 | Java8使用并行流(ParallelStream)注意事项
Spring--AOP、通知的执行顺序
JVM--理解介绍
JSF学习实战
策略模式--实战1
二叉树、二叉查找树、平衡树和红黑树概念

原文地址：https://www.cnblogs.com/BeyondTechnology/p/10203487.html