设为首页收藏本站

中国会计视野论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

查看: 1927|回复: 4

EDFP(ExtraDataFromPdf)自Pdf提取文字、图片、表格

[复制链接]
发表于 2019-9-10 14:13:34 | 显示全部楼层 |阅读模式
  美国注册管理会计师认证(CMA®)
现报名CMA享受6折优惠。
CMA获得政府及各大企业集团一致推荐
CMA是您挖掘职业潜能的通关秘钥
 

视野思享会年费会员
一年内免费直播参与
历届活动视频回放
与爱学习群体共同成长

 

欢迎订阅会计视野微信公众号
第一时间了解最新财会知识
碎片化学习新方法
200万读者追随的真爱选择。

本帖最后由 19860208 于 2019-9-10 14:17 编辑

EDFP(ExtraDataFromPdf),使用.NET+Python混合开发,利用itextsharp提取pdf中的文本、图片,Python中的pdfplumber三方库提取表格。程序不能替代Adobe Acrobat DC、Adobe Acrobat XI及SolidConverterPDF中的PDF转Word功能,也无法进行OCR文字识别。
EDFP(ExtraDataFromPdf)使用方法:
https://mp.weixin.qq.com/s?__biz=Mzg4MzA5NDgwNA==&mid=2247483895&idx=1&sn=249e43f5895920a512baa6a85c710744&chksm=cf4de58cf83a6c9a18161ec5b3dfbd3d6824ebcccec961ffd0caa4990fb260ee9733b295bf74&mpshare=1&scene=23&srcid=&sharer_sharetime=1568093166839&sharer_shareid=929f0d8473a362b6f7cf6e240fbce6e1#rd

下载地址:
https://share.weiyun.com/5xI2J0S 密码:w8hsgm
67.webp.jpg

提取后的表格

提取后的表格

提取后的图片

提取后的图片

提取后的文字

提取后的文字

提取完成

提取完成

操作界面

操作界面

评分

2

查看全部评分

发表于 2019-9-10 16:56:36 | 显示全部楼层
感谢分享
发表于 2019-9-10 20:42:57 | 显示全部楼层
帮你转发了。谢谢分享。
 楼主| 发表于 2019-9-10 21:53:33 | 显示全部楼层
复制忍者卡卡西 发表于 2019-9-10 20:42
帮你转发了。谢谢分享。

谢谢,哈哈
发表于 2019-9-11 09:02:48 | 显示全部楼层
您需要登录后才可以回帖 登录 | 注册 新浪微博登陆

本版积分规则

手机版|中国会计视野论坛 ( 沪ICP备05013522号-2  

GMT+8, 2019-9-22 07:31

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表