楼主: 思索者
6123 21

怎样识别超星和pdf中的文字,尤其是数字 [推广有奖]

  • 11关注
  • 5粉丝

学科带头人

36%

还不是VIP/贵宾

-

威望
1
论坛币
31653 个
通用积分
4894.6856
学术水平
29 点
热心指数
54 点
信用等级
29 点
经验
25919 点
帖子
870
精华
0
在线时间
2588 小时
注册时间
2006-5-5
最后登录
2025-11-9

楼主
思索者 发表于 2011-11-12 20:09:14 |AI写论文
100论坛币
从论坛中下载了中国科技统计年鉴,90年代的都是超星或pdf格式的,
超星中文字可以识别,数字却无法识别(部分数据可以一个数据一个数据的识别,但那样再复制粘贴不比自己输入快,无法整列数据识别),
pdf都是图片形式的,无法复制。这该怎么办

十几年、每年几十个行业,每个行业五六个变量,


--------------------
pdf基本可以解决了,但是超星怎么转换还是没有办法,希望大家鼎力相助。

关键词:PDF 中国科技统计年鉴 科技统计年鉴 中国科技统计 pdf格式 中国 图片 统计 行业

沙发
DejerLee 发表于 2011-11-12 20:19:04
下个CAJviewer试试呢?

藤椅
bsdsesws 发表于 2011-11-12 22:03:04
可以试试下一个AnyBizSoft PDF Converter V2软件,将PDF添加到软件中,然后选择 Select 中的 Excel ,单击 Convert 按钮开始转换!转换完毕后软件会自动提示“转换成功”,然后在“输出设置”下面打开。不过转换后最好校对一下。我试过还行的

板凳
quanjk 发表于 2011-11-13 08:07:15
这个是得转换

报纸
思索者 发表于 2011-11-13 09:38:10
DejerLee 发表于 2011-11-12 20:19
下个CAJviewer试试呢?
我试了一下
cajviewer可以识别数字,但经常会有乱码,还需要核对

地板
思索者 发表于 2011-11-13 09:39:42
bsdsesws 发表于 2011-11-12 22:03
可以试试下一个AnyBizSoft PDF Converter V2软件,将PDF添加到软件中,然后选择 Select 中的 Excel ,单击  ...
我试了一下,这个只能转可复制的pdf,对于图片格式的pdf没用,这个软件中的sample中的两个文件就是可复制的。

7
lzzpzz 发表于 2011-11-13 11:58:31
这个可以用PDF OCR

8
zuojin113 发表于 2011-11-13 12:08:42
我来帮你 用这个ABBYY.Finereader我想这个就是你需要的 以前我用过的 感觉不错 对付英汉互转或者扣取图片中的文字  才上传的哈 这是我上传的地址 只有20天的存续时间哦  http://kuai.xunlei.com/d/EAWIGXOLVTWI 有啥问题留言

9
zuojin113 发表于 2011-11-13 12:09:43
对了 用法写在压缩包的名称上面的哈

10
思索者 发表于 2011-11-13 16:52:30
zuojin113 发表于 2011-11-13 12:08
我来帮你 用这个ABBYY.Finereader我想这个就是你需要的 以前我用过的 感觉不错 对付英汉互转或者扣取图片中 ...
我下载试了,倒是能转换成word,但是转换不完全,乱七八糟,还有很多乱码,而且一会儿就自动关闭,再也找不到了。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-9 03:36