pyquery的问题 - 润新知

pyquery的问题

在使用pyquery时发现一些问题，

1.爬取的html中如果有较多的错误时，不能很好的补全。

2.如果要获取某个class中的内容时，如果内容太多不能取完整！只能取一部分。

这个在现在的最新版本中还没有很好的解决吧！

所以我就换回beautifulsoup，就没有这两个问题了！

使用lxml HTML 解析器：

BeautifulSoup(markup,"lxml")

速度也不会差到哪里去，html容错能力比pyquery好的多！

附上bs文档>>>
相关阅读:
[树状数组]JZOJ 4658 小Z调顺序
 [差分数组]JZOJ 3187 的士
 [BFS]JZOJ 4671 World Tour
[BFS]JZOJ 4672 Graph Coloring
[数学]JZOJ 4673 LCS again
shell：正则表达式和文本处理器
 开发脚本自动部署及监控
 Linux中的重启命令
 nginx和nfs
网络相关配置
原文地址：https://www.cnblogs.com/feng18/p/6104636.html