Xpath素材

from lxml import etree
text = """
<div>
    <ul>
        <li class="item-0"><a href="link1.html">first item</a></li>
        <li class="item-1"><a href="link2.html">second item</a></li>
        <li class="item-inactive"><a href="link3.html">third item</a></li>
        <li class="item-1"><a href="link4.html">fourth item</a></li>
        <li class="item-0"><a href="link5.html">fifth item</a>
    </ul>
</div>
"""
html = etree.HTML(text)
result = etree.tostring(html,pretty_print=True).decode('utf-8')
print(result)

from lxml import etree
text = """
<div>
    <ul>
        <li class="item-0"><a href="link1.html">first item</a></li>
        <li class="item-1"><a href="link2.html">second item</a></li>
        <li class="item-inactive"><a href="link3.html"><span class="bold">third item</span>></a></li>
        <li class="item-1"><a href="link4.html">fourth item</a></li>
        <li class="item-0"><a href="link5.html">fifth item</a></li>
    </ul>
</div>
"""
# 初始化一个Xpath解析对象
html = etree.HTML(text)
# 解析对象输出代码 是一个bytes类型
result = etree.tostring(html,encoding='utf-8')
print(type(html))  # <class 'lxml.etree._Element'>
print(type(result))  # <class 'bytes'>
print(result.decode('utf-8'))

相关阅读:
WinCE下SQLCE数据库开发（VS，VB.net，VC++)
基于VC++的WinCE网口通信
WinCE下的串口通信开发（VS2005，VB.Net，VC++）
多线程CSerialPort类的多串口通信实现
双T滤波电路用于PWM方式DAC的分析
AD9516锁相环功能外接环路滤波器的设计与分析
块结构中断有序化处理方法（一种单片机单线程方式下处理多中断的方法）
STM32F10X固件库函数——串口清状态位函数分析
STM32和STR71X移植uCos-II操作系统比较分析
基于uIP和uC/OS-II嵌入式网络开发

原文地址：https://www.cnblogs.com/zhangboblogs/p/10114698.html