请选择 进入手机版 | 继续访问电脑版
楼主: MRchesian
9896 16

[程序分享] Python利器: 利用 pdfminer 把pdf 年报数据转成 txt 文本 [推广有奖]

MRchesian 学生认证  发表于 2018-12-29 19:43:31 |显示全部楼层 |坛友微信交流群
myqinfei 发表于 2018-12-25 22:41
我在安装的过程中遇到了问题,能否麻烦指导下,有偿。我qq529604532
可以直接说什么问题

使用道具

舵手之达州 发表于 2019-5-8 03:54:30 来自手机 |显示全部楼层 |坛友微信交流群
MRchesian 发表于 2018-3-14 22:49
PDFMiner其特征有:
1、完全使用python编写。(适用于2.4或更新版本)
2、解析,分析,并转换成PDF文档 ...
你好,我在批量转换的时候出现加密还有各种情况,你那有转好的可以给我用吗,有偿也行!

使用道具

dgdgmariner 在职认证  发表于 2019-5-11 01:13:18 |显示全部楼层 |坛友微信交流群
有现成的软件,何必那么费劲?

使用道具

MRchesian 学生认证  发表于 2019-5-16 15:56:58 |显示全部楼层 |坛友微信交流群
dgdgmariner 发表于 2019-5-11 01:13
有现成的软件,何必那么费劲?
你可以介绍下有什么好用的软件

使用道具

wudizhao 发表于 2019-12-26 23:52:22 |显示全部楼层 |坛友微信交流群
MRchesian 发表于 2018-9-16 22:03
加密也是有办法的, 关键是有些PDF的字符编码不统一才是坑,我处理的是90-16年的年报数据 3w+份
那请问你是如何解决的?

使用道具

panghongwei 发表于 2020-1-13 22:25:36 |显示全部楼层 |坛友微信交流群
您好,咨询一下,我把pdf转成txt后,txt里怎么都是(cid:3846)(cid:1183)(cid:3248)(cid:1041)((cid:1905))/2019 (cid:2893)/12 (cid:4357)/31 (cid:3248)/(cid:1467) 001 (cid:1009) 这些东西呢

使用道具

Xiaokeyi_007 发表于 2020-3-24 17:40:57 |显示全部楼层 |坛友微信交流群
您好,请问安装包安装好之后是放到哪里呢?cmd输入命令后一直报错文件不存在,谢谢!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 14:43