通常我们在工作当中,有时候需要提取PDF文件中的指定出来,一般需要会员或者在网上寻找其他工具才能完成,需要耗费大量的时间和精力。



为了应对这种情况,使用Python的PyPDF2模块编写了一个小程序来完成提取:

运行日志

生成的文件

print("页码:以逗号(,)分割,连续页码以连字符(-)分割。") pages =input("请输入需要提取的页码:") try: pagelist = deal_page(pages) print(">>>>即将提取的页码如下:") print(pagelist) output = PdfFileWriter() pdf_file = PdfFileReader(open("AAAAAAAA.PDF", "rb")) pdf_pages_len = pdf_file.getNumPages() for i in pagelist: output.addPage(pdf_file.getPage(i-1)) outputStream = open("output.pdf", "wb") output.write(outputStream) outputStream.close() print(">>>>恭喜你,PDF已提取完成,快去看看吧!<<<<") input("输入Enter键退出...") except Exception as e: print(">>>>请正确输入页码<<<<") print(e)

大家一般是如何提取PDF特定页的呢,欢迎评论区留言。