发布时间:2023-12-21 14:00
大家好哇
从 PDF 里 copy 表格时,粘贴出来后格式都是错乱的。这麻烦事交给 Python 再合适不过里,我开发了一个从 PDF 抽取表格另存为 Excel 文件的应用,我把它部到 huggingface 了,同学可以直接去感受一下:
https://huggingface.co/spaces/beihai/PDF-Table-Extractor
准备一个PDF(暂不支持扫描版)
页面中上传PDF,也不支持过大的200M以上的文件,如果太大,大家可以先去压缩一下,我记得adobe官网有就类似小工具。
上传完成后,选择表格所在PDF的页码,等待片刻就会出现“提起完成,点击下载”
下载Excel,格式还需要微调,不过比直接复制出来的要好很多了,能节省一些时间。
目前这个工具我还在完善,比如直接梭哈,抽取PDF中所有表格,敬请期待。
实现方法之后再公布吧,其实经常看我文章的同学应该都很熟悉了吧。
之前在腾讯的这个算法,我搬到了网上,随便玩!一文中有介绍
本文代码能在huggingface看到,其实也是刚刚调试好,觉得有用,期待三连。
使用“Opencv“时遇到terminate called after throwing an instance of ‘cv::Exception‘问题的解决方案
开利网络组织第七期链企来资源对接沙龙会,让企业“链企来”,让资源变现快!
从零搭建vite + vue3.0 + vuex + router + sass/less + naive
视频教程-Vue全家桶从基础入门到进阶项目实战第三篇中级进阶实战篇-Vue
无需CORS,用nginx解决跨域问题,轻松实现低代码开发的前后端分离
Vuex持久化插件(vuex-persistedstate)
蓝桥杯第十一届单片机国赛真题(CT107D——IAP15F2K61S2)