• BeautifulSoup的选择器


    用BeautifulSoup查找指定标签(元素)的时候,有几种方法:

    soup=BeautifulSoup(html)

    1.soup.find_all(tagName),返回一个指定Tag元素的列表

    2.soup.select(selector),返回一个指定Tag元素的列表,是非常好用的方法,它支持大部分css选择器(可在链接页面内查找"CSS选择器"相关章节),如类选择器,id选择器,子代选择器(但不支持直接子代选择器)

    例如可以这样写,soup.select('.listConent div ul li'),表示要查找class='listContent'的某个标签下的div标签的ul标签下的所有li元素。

    如果你想查找class='listContent'的某个标签下的直接子代div标签,soup.select('.listConent > div'),而jquery写成$('.listConent > div')

    3.你可以逐层访问Tag的子标签[链接,可在链接页面内查找".contents 和 .children"章节],如 x.div.next_sibling.div.p.a.string

    参考:

    http://blog.csdn.net/fangwc/article/details/51192057

  • 相关阅读:
    01
    py5.30
    py 5.28
    py5.25
    py 5.24
    py 5.22
    py5.21
    py 5.18
    py 5.17
    py 5.16
  • 原文地址:https://www.cnblogs.com/aaronhoo/p/5917828.html
Copyright © 2020-2023  润新知