首页 pdf正文内容

「技能分享」PDF中的表格一行代码就能取出来

pdf

2025-01-04 19:46:17

需求

1.我在技术交流群里发了这样一个PDF，并说了明天公布答案。

2.PDF里有很多有用的信息，这些信息都不怎么好直接拿来用

3.今天我就来分享一下怎么提取出这个PDF中的表格。

开搞

4.提取这个信息其实很简单，只需按照下图所示的代码就可以提取出里面的信息并存盘。

5.附上图中代码import tabula#读取pdf数据，并取pdf中的第一个表格df = tabula.read_pdf(r'C:UsersuYaoQiDesktoptst.pdf',pages='all')[0]#不带索引写出表格到磁盘df.to_excel(r'C:UsersuYaoQiDesktoptst.xlsx',index=None)几行代码，简简单单！写出的数据：

总结

提取过程没什么好说的，非常的简单！只能说tabula这个库太强大了，这个需求如果用FME来做的话，也不是不行，只是不会有这么方便

6.也许还有其他的方式来做类似的事情，但大概也不能比这个库更简单了。

最简化雅思写作之15句框架模板，共200页+，PDF可打印~

« 上一篇

UPDF - 实现高效PDF编辑的全能工具！让PDF处理如虎添翼！

下一篇 »

更多相关文章

推荐文章

年会PPT怎么做(年会ppt怎么做好看)

年会PPT怎么做(年会ppt怎么做好看)

我哭了，早知道PPT排版有这么简单就好了

我哭了，早知道PPT排版有这么简单就好了

怎么才能用PPT赚到钱呢，PPT不过就是一个文档啊,它怎么能赚钱呢？

怎么才能用PPT赚到钱呢，PPT不过就是一个文档啊,它怎么能赚钱呢？

ICO推荐

两种方法告诉你如何给文字设置背景(文字背景在哪里设置)

做PPT时图片不要直接插入，套用这4个小技巧，让你的PPT更加高大上，转发分享

PPT里的图片，居然能自动上色，长见识了

热门文章

最新文章

标签列表