26.1 XPath helper
26.1.1 XPath helper 插件概述
xPath helper 是一款 Chrome 浏览器的开发者插件,安装了 xPath helper 后就能轻松获取 HTML元素的 xPath,程序员就再也不需要通过搜索 html 源代码,定位一些 id 去找到对应的位置去解析网页了。
26.1.2 XPath helper插件功能介绍
Google 插件 XPath Helper 可以支持在网页点击元素生成 xpath,整个抓取使用了 xpath、正则表达式、消息中间件、多线程调度框架(参考)。xpath 是一种结构化网页元素选择器,支持列表和单节点数据获取,他的好处可以支持规整网页数据抓取。
如果我们要查找某一个、或者某一块元素的 xpath 路径,可以按住 shift,并移动到这一块中,上面的框就会显示这个元素的 xpath 路径,右边则会显示解析出的文本内容,并且我们可以自己改动 xpath 路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的 xpath 语句是否书写正确。
26.1.3 XPath helper 插件下载
你可以从 chrome 应用商店里找到 chrome 爬虫插件,如果你的 chrome 应用商店无法打开,你可以从我的网盘(对应书的配套工具)里获取(xpath-helper.crx)。
26.1.4 XPath helper 插件安装
1. 如果你能够打开 chrome 应用商店,并且可以找到 chrome 爬虫插件,那么直接点击“添加至 chrome”,如下图所示:
2 . 如果你的 chrome 应用商店无法打开,你从我的网盘或者其他途径获得了chrome 爬虫插件,那么就选择离线安装该插件。由于 chrome 爬虫插件同其他 chrome 插件一样都是 CRX格式的,具体的安装方法如下:
1)在 chrome 中新开一个窗口,输入:chrome://extensions/ 回车,打开应用管理器。
2)把 crx 文件拖到应用管理器界面里,松开鼠标,会弹出安装提示,点击确定安装就可以了。
3)重新启动浏览器,ctrl+shift+x 即可使用。
下面以腾讯社招网职位信息为例介绍一下:
https://hr.tencent.com/position.php?&start=0
--------------------------------------
个人今日头条账号: 听海8 (上面上传了很多相关学习的视频以及我书里的文章,大家想看视频,可以关注我的今日头条)