• 使用BeautifulSoup模块解析HTML


    问题:

    UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for this system ("html.parser"). This usually isn't a problem, but if you run this code on another system, or in a different virtual environment, it may use a different parser and behave differently.
    
    The code that caused this warning is on line 10 of the file D:python_work	est	est.py. To get rid of this warning, pass the additional argument 'features="html.parser"' to the BeautifulSoup constructor.
    
      noStarchSoup = bs4.BeautifulSoup(res.text)

    解决方法:

        noStarchSoup = bs4.BeautifulSoup(res.text,features='html.parser')

    《CSS选择器的例子》,select()方法将返回一个Tag对象的列表

    传递给select()方法的选择器 将匹配...
    soup.select('div') 所有名为<div>的元素
    soup.select('#author') 带有id属性为author的元素
    soup.select('.notice') 所有使用CSS class属性名为notice的元素
    soup.select('div span') 所有在<div>元素之内的<span>元素
    soup.select('div >span') 所有直接在<div>元素之内的<span>元素,中间没有其他元素
    soup.select('input[name]') 所有名为<input>,并有一个name属性,其值无所谓的元素
    soup.select('input[type="button"]') 所有名为<input>,并有一个type属性,其值为button的元素

     

     

     

     

     

     

  • 相关阅读:
    STL(七)之萃取技术
    STL(六)之空间配置器
    为Oracle配置监听
    Oracle11.2.01安装过程
    SVN简介
    SVN客户端安装教程
    SVN服务器安装教程
    排序算法-冒泡排序
    使用Struts2实现超级文本的链接
    排序算法-快速排序
  • 原文地址:https://www.cnblogs.com/leisurelyRD/p/10754138.html
Copyright © 2020-2023  润新知