前言:
最近学习python,找的电子书基本没有目录,发现文泉试读里面有目录 就抱着试试 找了找,很快找到了目录文件 是json文件,但并不知道如何解析。于是一直放着。
2020年5月26日学习了 python 列表、for、字典的皮毛等相关知识。勉强解决问题。
python解析这里应该会有更好的方法,但我目前根据自己学到只能这样做啦。愿意分享的可以分享下。谢谢
步骤:
网上有借鉴,但借鉴的教程在寻找目录方面比较麻烦,因此没有马上行动。之后才有了上面的找目录的发现。
一、提取目录
二、使用 PdgCntEditor 软件添加目录
三、检测检查目录
一、提取目录
1、找到对应电子书文泉试读—— 打开审查元素—— network—— 搜索到目录相关文字 找到目录json
2、双击自动选中 可以直接打开 复制 或者 复制链接下载都行。
3、然后看到是这样一个数据。
4、接着用到刚学的python基础知识
桌面存放刚刚保存的json数据 json.txt
1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 import json 4 # 读取数据 5 with open(r'C:UsersHAPPYDesktopjson.txt', 'r', encoding="utf-8") as f: 6 load_dict = json.load(f) 7 json_len = len(load_dict["data"]) 8 for i in range(0, json_len): 9 json_label = load_dict["data"][i]["label"] 10 json_pnum = load_dict["data"][i]["pnum"] 11 print(json_label, json_pnum) 12 if "children" in load_dict["data"][i]: 13 json_len_children = len(load_dict["data"][i]["children"]) 14 for z in range(0, json_len_children): 15 children_json_label = load_dict["data"][i]["children"][z]["label"] 16 children_json_pnum = load_dict["data"][i]["children"][z]["pnum"] 17 print(children_json_label, children_json_pnum)
二、使用 PdgCntEditor 软件添加目录
1、先打开软件 打开需要添加的目录 然后把刚刚python解析的目录复制到空白
全选目录文字 点击 自动切分页码
2、这里的目录 和电子书基本是核对得上的。
基准页就是PDF 打开的第一页,要和目录对应。
确定后保存
3、不用目录排版 也行,我这里目录只有1级,多级目录就点下缩进排版 。软件具体操作看上面参考链接
三、检测目录 (ok 没有问题)