python3 使用 lxml 解析 HTML 时出现中文乱码 - 润新知

python3 使用 lxml 解析 HTML 时出现中文乱码
python3 使用 lxml 解析 HTML 时出现中文乱码

问题
- 没有进行编码, 解析中文时乱码
```
html = etree.parse(html_path, etree.HTMLParser())
```
解决办法
- 在指定 parser 的时候对 HTML 进行编码
```
html = etree.parse(html_path, etree.HTMLParser(encoding="utf-8"))
```
相关阅读:
MySQL 5.5版本数据库介绍与二进制安装
 nginx配置文件的基础优化
 yum源是什么
 微服务之间调用token管理
 微服务之间调用事务处理
 idea
sentry
infinispan配置
 微服务事务处理
 高并发处理
原文地址：https://www.cnblogs.com/gxfaxe/p/15294536.html

Copyright © 2020-2023 润新知