项目需求: 通过Python将PDF转化为图片进行后续处理

项目所需组件: fitz PyMuPDF

安装组件 // 注意安装顺序,否则执行会报错

pip install fitz

pip PyMuPDF

import datetime

import os
import fitz

def pyMuPDF_fitz(pdfPath, imagePath):

startTime_pdf2img = datetime.datetime.now() # 开始时间
print("imagePath=" + imagePath)

pdfDoc = fitz.open(pdfPath)

for pg in range(pdfDoc.page_count):

page = pdfDoc[pg] rotate = int(0)

# 每个尺寸的缩放系数为1.3,这将为我们生成分辨率提高2.6的图像。

# 此处若是不做设置,默认图片大小为:792X612, dpi=96

zoom_x = 2.33333333

# (1.33333333-->1056x816) (2-->1584x1224)

zoom_y = 2.33333333

mat = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)

pix = page.get_pixmap(matrix=mat, alpha=False)
if not os.path.exists(imagePath):

os.makedirs(imagePath) # 若图片文件夹不存在就创建
pix.save(imagePath + '/' + 'images_%s.png' % pg)
endTime_pdf2img = datetime.datetime.now()

if __name__ == "__main__":

pdfPath = r'C:UsersAdministratorDesktoptemptest.pdf'

# 2、需要储存图片的目录

imagePath = r'C:UsersAdministratorDesktoptemp'

pyMuPDF_fitz(pdfPath, imagePath)