用 Python 开发的 PDF 抽取Excel表格 2.0版

前些天向大家介绍了我开发的从PDF抽取表格小工具的使用方法（⬅️点击直达），有同学反馈说有一些问题：

针对以上情况，我在原功能基础上进行了优化，本文依旧不涉及代码，具体实现过程我考虑在B站直播讲解。

这里就将优化部分的使用方法介绍一下

单页PDF包含多个表格

这部分已经做了代码优化，前端也有一点点变化
20220621141911

选择具体页码后，自动弹出抽取完成，下载的Excel包含多个sheet页，对应多张表格。

有些 PDF 中的表格线条是透明的,比如下图这种情况

大家可以在线条是否透明下拉框选择 True

20220621142046

如果想要抽取一个PDF中所有的表格，在页码处填写 all 即可。

当然，如果页码较多，如此操作会很慢，需要耐心等待。

也可以填页码区间，比如1-3页就填1-3，第十页到最后一页，可以填10-end

20220621142708
如果某些表格没有被提取，可以重新选择表格线条是否透明重跑一下。

以上。欢迎三连。

另。

直播暂定周日晚，大家没有关注我bilibili，欢迎来波关注，届时会在动态发预告。
20220621132441

相关阅读:
HBASE数据模型&扩展和负载均衡理论
JVM Safepoint 安全点
JVM垃圾回收算法及垃圾收集器
JVM运行时数据区域
Java IO、BIO、NIO、BIO
Java反射
Zookeeper
二叉树深度
二叉树层次遍历
KMP算法

原文地址：https://www.cnblogs.com/jpld/p/16441804.html