• XPath helper


    26.1  XPath helper

    26.1.1 XPath helper 插件概述

    xPath helper 是一款 Chrome 浏览器的开发者插件,安装了 xPath helper 后就能轻松获取 HTML元素的 xPath,程序员就再也不需要通过搜索 html 源代码,定位一些 id 去找到对应的位置去解析网页了。

    26.1.2  XPath helper插件功能介绍

    Google 插件 XPath Helper 可以支持在网页点击元素生成 xpath,整个抓取使用了 xpath、正则表达式、消息中间件、多线程调度框架(参考)。xpath 是一种结构化网页元素选择器,支持列表和单节点数据获取,他的好处可以支持规整网页数据抓取。

    如果我们要查找某一个、或者某一块元素的 xpath 路径,可以按住 shift,并移动到这一块中,上面的框就会显示这个元素的 xpath 路径,右边则会显示解析出的文本内容,并且我们可以自己改动 xpath 路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的 xpath 语句是否书写正确。

    26.1.3  XPath helper 插件下载

    你可以从 chrome 应用商店里找到 chrome 爬虫插件,如果你的 chrome 应用商店无法打开,你可以从我的网盘(对应书的配套工具)里获取(xpath-helper.crx)。

     

    26.1.4  XPath helper 插件安装

    1. 如果你能够打开 chrome 应用商店,并且可以找到 chrome 爬虫插件,那么直接点击“添加至 chrome”,如下图所示:

     

    2 . 如果你的 chrome 应用商店无法打开,你从我的网盘或者其他途径获得了chrome 爬虫插件,那么就选择离线安装该插件。由于 chrome 爬虫插件同其他 chrome 插件一样都是 CRX格式的,具体的安装方法如下:

    1)在 chrome 中新开一个窗口,输入:chrome://extensions/ 回车,打开应用管理器。

     

    2)把 crx 文件拖到应用管理器界面里,松开鼠标,会弹出安装提示,点击确定安装就可以了。

     

    3)重新启动浏览器,ctrl+shift+x 即可使用。

    下面以腾讯社招网职位信息为例介绍一下:

    https://hr.tencent.com/position.php?&start=0

     --------------------------------------

    个人今日头条账号: 听海8   (上面上传了很多相关学习的视频以及我书里的文章,大家想看视频,可以关注我的今日头条)

     

     

  • 相关阅读:
    C#-----类DateTime的常用方法
    C#-----字节数组(byte[])和字符串相互转换
    maven执行update命令时报org/apache/maven/shared/filtering/MavenFilteringException错误
    关于dubbo服务的xml配置文件报错的问题
    The method getTextContent() is undefined for the type Node
    jetty各个版本对应的jdk版本
    dubbo启动报java.lang.ClassNotFoundException: javassist.ClassPath
    MAC下安装多版本JDK和切换几种方式
    安装第三方jar包的两种方式
    使用 Nexus 搭建私服仓库时我犯的一个小错误
  • 原文地址:https://www.cnblogs.com/tinghai8/p/9552539.html
Copyright © 2020-2023  润新知