因为搜狗与腾讯的合作关系,微信是为搜狗浏览器开设了一个数据读取的端口的,打开 http://weixin.sogou.com/ 可以进入微信搜索界面,搜索相关文章,搜索某一公众号。
1. profile
比如我们在其中搜索“大数据文摘”这一公众号,页面显示的如下的一个条目就是所谓的 profile(简介):
ctrl+shift+i 调出 Chrome 的开发者工具,选中 Elements,鼠标点击上面的该公众号的 profile,在下侧的 html 源码处,右键,【copy】⇒ 【xpath】获得其 xpath:
- //*[@id=”sogou_vr_11002301_box_0”]
通过 profile 的相关信息,我们还可以获得推送文章的:
- 链接的提取方式可以直接通配成:h4.weui_media_title hrefs
- 标题的提取方式可以直接通配成:h4.weui_media_title text
- 摘要的提取方式可以直接通配成:p.weui_media_desc
- 发布时间的提取方式可以直接通配成:p.weui_media_extra_info