• 【爬虫】微信读书笔记如何导出到本地?


    前言

    我在微信读书APP上看了一些书,但很多都只是过了一遍,看完了也就忘了。这对于专业书籍来说,读一遍相当于没读,所以把自己做的笔记导出来看看增强记忆,是很有必要的。

    遗憾的是微信读书APP只提供了将笔记复制到剪切板,然后粘贴到其他地方,而PC端版本连剪切的功能都没有,更不用说导出了。更为操蛋的是这个APP支持选择的笔记条数是有限的,如果笔记做得多的话,你得分好几次选择导出,而且要找到上次选择的位置。作为中国最大的互联网公司的核心产品之一,这种简单的需求都满足不了,我只能忍住爆粗口。

    于是,我在网上找了个别人开发的爬虫工具,将自己的微信读书笔记内容导了出来,简要记录下。

    实践

    1. 爬虫工具准备
    Github上的源码:https://github.com/arry-lee/wereader,Python3写的,将其克隆到本地。
    使用方法都有简单说明:

    • 浏览器打开 https://x.weread.qq.com
    • 微信扫码登录确认,提示没有权限忽略即可
    • F12 获取 Cookie 字符串拷贝到 settings.py
    • Cookie 一段时间就会失效 必须重新登录获取

    2.获取cookie
    这步是关键,关于怎么获取,可见这个回答:https://jingyan.baidu.com/article/5d368d1ea6c6e33f60c057ef.html
    。我使用的是第一种方法获取cookie
    image.png

    3.导出笔记
    使用任意一个IDE,我用的Pycharm,新建一个工程,打开脚本,先在settings.py中设置好刚拷贝的cookie,如下:
    image.png

    设置好后,运行client.py程序即可,可根据自己需求修改脚本,导出笔记保存,笔记导出的格式可以是markdown
    image.png

    image.png

    不过我发现,这个工具导出的内容并不全面,有些我明明是做了笔记却没有导出。而且它导出的章节顺序是反的,这可就一点也不友好了。当然,可以在作者脚本的基础上修改,后续有时间再看看。

  • 相关阅读:
    centos8.0 安装 jenkins
    No match for argument: mysql-community-server Error: Unable to find a match: mysql-community-server
    Navicat 远程连接 centos8.0
    centos8.0 安装 mysql
    -bash: java-version: command not found
    centos8.0 安装 JDK1.8
    [Err] 1062
    android之Fragment基础详解(一)
    Android之RecyclerView(一)
    Android之ProgressBar
  • 原文地址:https://www.cnblogs.com/jessepeng/p/12273604.html
Copyright © 2020-2023  润新知