吴裕雄--天生自然python学习笔记：网页解析

抓取万水书苑网页中所有＜a>标签中的超链接井显示。

import requests
from bs4 import BeautifulSoup

url = 'http://www.wsbookshow.com/'
html = requests.get(url)
html.encoding="gbk"

sp=BeautifulSoup(html.text,"html.parser")
links=sp.find_all(["a","img"]) # 同时读取 <a> 和 <img>
for link in links:
    href=link.get("href") # 读取 href 属性的值
    # 判断值是否为非 None，以及是不是以http://开头
    if(href != None)and(href.startswith("http://")): 
        print(href)

相关阅读:
关于wince 版本的支持——用_WIN32_WCE来做判断？
【转载】關於 ROMonly Files System——这个对掉电保存非常有用
 【资讯】wince 更新地址改变了，这里贴一个新的，大伙好找。
【讨论】如何降低nandflash读写速度？
一个低级的S3c2416 wince SD eboot汇编错误
 【转载】SQL CE 3.0 与SQL CE 3.5区别
 【资讯】关于wince 7 授权费以及开发工具软件费一览表，啥时候我也试试。
报告一下我最近做的事情
 wince 三年之后，忍痛分析微软在移动互联网上不能做大的原因
 奶奶的熊，就是因为一跳串口线，导致一个客户重新做了一次S5pv210 底板，烧写wince6.0 两周不成功，哎，实在没办法，叫他发电路板给我调试，我发现居然是串口线！
原文地址：https://www.cnblogs.com/tszr/p/12021398.html

Copyright © 2020-2023 润新知