• python实现PDF转PNG


    说明
    为了方便将pdf格式发票转为图片,找到以下方法,转换后的效果非常不错,特此记录在自己的笔记中,根据自己的需要,代码稍微有所优化修改

    参考网址:https://zhuanlan.zhihu.com/p/102742847

    三方库安装

    pip install fitz
    pip install PyMuPDF
    

    代码示例

    import os
    import fitz
    
    
    def pdf_to_image(pdf_path, img_path=None, zoom_x=5, zoom_y=5, theta=0):
        """
        PDF转PNG
        :param pdf_path: pdf文件的路径
        :param img_path: 图像要保存的文件夹
        :param zoom_x: x方向的缩放系数
        :param zoom_y: y方向的缩放系数
        :param theta: 旋转角度
        :return: dst_path
        """
        if not img_path:
            img_path = os.path.abspath(os.path.join(pdf_path, '../'))
    
        with fitz.open(pdf_path) as pdf:
            name = os.path.basename(pdf.name)
            file_name = name.split('.')[0]
            page = pdf[0]
            # 设置缩放和旋转
            trans = fitz.Matrix(zoom_x, zoom_y).preRotate(theta)
            pm = page.getPixmap(matrix=trans, alpha=False)
            dst_path = f'{img_path}/{file_name}.png'
            # 保存
            pm.writePNG(dst_path)
    
        return dst_path
    
    博主箴言:该博文中的文字内容仅供参考学习,如有不当之处还望各位不吝赐教,为博主指点一二,不胜感激:▄︻┻┳═一…… ☆(>○<)
  • 相关阅读:
    111
    使用正则表达式,取得点击次数,函数抽离
    爬虫大作业
    Hadoop综合大作业
    hive基本操作与应用
    熟悉HBase基本操作
    爬虫大作业
    第三章 熟悉常用的HDFS操作
    数据结构化与保存
    用正则表达式,取得点击次数,函数抽离
  • 原文地址:https://www.cnblogs.com/rongge95500/p/14618361.html
Copyright © 2020-2023  润新知