本帖如果不适合发在这里,麻烦版主删除。
首发于:http://dlsz.5d6d.com/thread-536-1-1.html
本文只说PDF、DJVU和PDG的收藏及再加工,不涉自己动手扫描制作。
一、为什么要收藏电子书?
很简单,第一、时代进步了,技术发展了,所有的纸本书籍都可以扫描成图片保存在电脑里了。这就方便得多了,占用的空间也小得多了,流传共享也更容易了。第二、电子书比纸本书便宜多了。试想,如果你想拥有一套《四库全书》,你打算用多大的地方来存放?多少的钱来购买?电子书就不同了,你只有能上网,你就能下载,1T以上的硬盘已经随处可见,足够你下几套这样的书了。
当然,凡是有得必有弊,电子书是便宜且方便,但长时间对着显示器,视力再好的人也受不了,所以懂得自我保护还是很重要的。关于眼睛保护方面的知识,不在本文所说范围内,请自行搜索相关资料。
二、常见的电子格式
网络上的电子书分为两大类:图像电子书(或称扫描版电子书)和文本电子书。本文只说扫描版的电子书。
扫描版电子书,网上最的常见格式有:PDG、PDF、DJVU(本文也只说这三种格式)。
PDG是超星公司开发的一种电子书格式,早期的文件格式名称为:001、002、003……后来就统一为PDG。原来的超星(PDG)也是不加密的,超到后来,密级就越高,从AAH到66H,再到67H,直到现在的68H,越往后,其加密限制程度越高。超星网站上的图书非常之多,好书同样非常之多,但要钱。没钱,你就没法下载电子书。当然,也有一些学校购买有超星图书,但这些下载来的PDG往往都是快速版(DPI150),而不是清晰版(DPI300),这对于某些字体较大,印刷质量较好的书来说,问题还不大。但如果你遇到纸本的印刷质量较差或者字体较小的,那你最好将此书删除,因为它只好占用你的空间,你却无法分辨出那些书上究竟印了什么。而这些都还不重要,重要的是:超星格式现在都是加密的,并且保存期是有限的!而这几年的超星PDG,还出现一个新问题,就是扫描黑白图书时采用JPG格式,而不是TIF格式,导致文件体积巨,一本几百页的书,可能就要上百甚至几百M。
PDF,网上最常见的电子格式,说是网络文档的标准格式都不为过。使用方便,制作、修改等都有软件。
DJVU,近几年出现的新贵,它的优点就在于:在制作电子书时,将背景和前景分离,比如白纸黑字的书,白色背景采用了非常低的分辨率,黑色前景则采用了高分辨率,这样就在提高了清晰度的同时降低了文件的大小。所以很多清晰都相同的书,DJVU往往比PDF小一些。但这种格式出现时间不太长,在操作方便性方面还不如PDF,而且还有一个最大的缺点,就是如果文件过大,消耗的内存是相当惊人的,这一点PDF则没有此种问题。至于PDG,则是三种之中体积最大的。
其它的还有国家图书馆(简称国图)的NLC,以及方正等等,但我一般也很少收藏这些格式,所以在此从略。
文本的格式常见的有:TXT、CHM、EXE、DOC等,就不详细介绍了。由于文本类的,除了个别有热心网友校对之外,非常多都错误一大堆,在硬盘容量已经不是问题的年代,实在不适合收藏。提醒一句,收藏CHM、EXE等电子书时小心木马和病毒。
三、如何阅读电子书
PDG可以用超星公司的超星阅读器,但强烈推荐用老马的“UnicornViewer”阅读。
PDF可用“Adobe Reader”或“FoxitReader”阅读。“Adobe Reader”为正宗的PDF阅读器,但体积实在过于宠大,“FoxitReader”则较小巧,但有时可能会有阅读效果上的差异。
DJVU则用“WinDjView”阅读,目前已经有1.03版。
四、下载电子书
网上下载的地方很多,我常去的有:电驴(http://www.verycd.com/)、国学数典(http://bbs.gxsd.com.cn)、龙腾国学(http://bbs.ltgx.net/?from^^uid=258)、爱如生论坛(http://forum.er07.com/?from^^uid=4179),读书中文网(http://www.rbook.net/plugin/spread/?uid=124),石渠藏简(http://www.shiqu.info/)等等。当然,我自己的论坛也不错:东里书斋(http://dlsz.5d6d.com/)。(一点说明,后面带的数字都是我的推广号,点击对你没有任何损害,只会增加我的积分值。)
现在的电子书网站基本上下载都需要虚拟货币,获得的办法一般都是通过发帖、上传共享资料等。要注意的是, 如果下载附件需要积分,千万不要使用快车、迅雷之类的下载软件,直接采用右键别存为,用IE单线程下载。如果使用软件,有可能一个10M的附件便要你付出几百甚至几千积分的代价。
上面的网站中,电驴(http://www.verycd.com/)其实是一个共享资料的网站,共享的不止是电子书,还有影视、歌曲、游戏等等凡是能够传输的东西几乎都可以在上面共享。
国学数典(简称数典)(http://bbs.gxsd.com.cn)是一个个人出资办的电子书公益网站,里面国学方面的精品书籍非常之多,包括诸如《四库荟要》、《续修四库全书》、《丛书集成》新编、续编、三编这样的大部头,估计穷尽我们一生的精力都看不完。而且该网站还有很多海外收藏的中国古籍,精品极多,总之一句话,该网站目前堪称传播国学电子书方面的龙头。而且该网站是以图像电子书为主,同时还有文本书籍。
龙腾国学(简称龙腾)(http://bbs.ltgx.net/?from^^uid=258)同样是一个私人论坛,和国学数典类似,属于后起之秀。
读书中文网(简称中文网)(http://www.rbook.net/plugin/spread/?uid=124)几经波折,依旧顽强地存在着。
爱如生网站(http://forum.er07.com/?from^^uid=4179),只提供民国之前的图书(无版权纠纷),对于网上常见的数据提供免费下载,这一点比较好。精品也不少,值得一看。
至于石渠藏简(简称石渠)(http://www.myshiqu.com/),他的主人,是网络上大名鼎鼎的“瑚链”,诸如《续修四库全书》、《丛书集成》(PDF版本)就是他的作品,而且精品还远不止这些,可以这样说,如果在网上收藏过古典图像电子书,基本上你都会下载他的作品,同样几经波折。最近又有从头再来的迹象,值得期待。
其它的基本上以文本电子书为主,我较少去,大家有空可以自己去看看。再提醒一句,收藏CHM、EXE等电子书时小心木马和病毒。
五、关于电子工具
收藏电子书,总会有些不合心意,比如不喜欢PDG,想转成PDF或DJVU怎么办?又比如想将图像OCR怎么办?又如想加上书签,便于阅读怎么办?这时,一此常用的电子书工具就必须具备。
(1)PDF相关
PDF阅读器:“Adobe Reader”或“FoxitReader”,网上一搜一大堆。
PDF制作、编辑工具:
jaws pdf editor:我最主要用它来制作书签和替换一两个页面,其它的功能大家自己在网上搜一搜。
Adobe Acrobat Pro:Adobe公司的软件,最正宗的PDF制作、编辑器,具体使用我目前也不熟,大家共同摸索。
CAJViewer:可以对PDF进行OCR,但好像不支持繁体?
其它还有PDF解密(主要用来解PDF打开密码及功能锁定)、PDF虚拟打印之类的,网上一搜就有。
(2)DJVU相关
DJVU阅读器:建议“WinDjView”。
Document Express Editor:主要用来增加书签,使用起来不甚方便,制作简单的书签还是够用的,凑合着用吧。
Document Express Enterprise:正宗的DJUV制作器,网上有破解版的。可以将文件通过虚拟打印制作成DJVU。
(3)PDG相关
PDG阅读器:建议老马的“UnicornViewer”(独角兽),新版的UnicornViewer支持UVZ格式文件,所谓UVZ其实就是将ZIP格式直接修改而成的。当然你也可以到超星的主页上下载超星阅读器,但不推荐。使用超星官方阅读器唯一的好处就是它附带有OCR功能。
PDG解密:pdgreader pro、SUPPER、PIZZA等,不要问我要,这些东西原作者都严禁传播的,我也没有。
PDG减肥:ComicEnhancerPro。现在的超星,经常出现将黑白纸本扫描成JPG的事情,我一直用这个来减肥。同样是老马软件。
PDG检查:PdgThumbViewer。还是老马软件,可以检查PDG的黑线页(下载不完整所导致)、缺页及文件格式。
PDG转换:PdgStore、Pdg2Djvu、DjVuToy,以上都是PDG转DJVU用。转换成PDF可以采用虚拟打印,但不推荐,推荐直接采用老马的Pdg2Pic、FreePic2Pdf两种软件配合,转成PDF,速度很快,质量基本上没有损失。当然,采用Pdg2Pic、FreePic2Pdf的前提条件是:你的PDG文件不能是诸如AXH、6XH之类的加密格式。
(4)OCR工具
如果你觉得图像的太大,也不利于重新利用,可能进行OCR(光学字符识别技术)。PDF可以采用CAJViewer或“Adobe Acrobat Pro”,DJVU可以采用“Document Express Enterprise”,PDG则超星阅读器便附带有OCR功能。当然,也可以采用老马软件进行,但我也没用过,所以具体怎么样我也不知道,大家如果有兴趣可以到老马的空间去看看:http://www.comicer.com/stronghorse/software/index.htm。
六、上传共享
收藏不能只顾着自己,有好东西,要拿出来与大家共享,这样才能交流有无。
一般的网站,上传都有限制,小于限制的文件,可以直接上传。大于限制则可以采用WINRAR分割。对于PDG,如果小于网站限制,建议采用ZIP格式压缩后直接上传,不要采用RAR,因为采用ZIP可以直接用“UnicornViewer”阅读(也可以改成UVZ格式直接与UnicornViewer关联)。PDF如果小于限制,不必压缩,只要网站直接PDF格式上传,直接上传就可以了。DJVU建议采用RAR压缩,便于检查文件的完整性(强烈推荐,理由后面会说)。以上文件压缩时,可以选择“储存”方式即可。因为这些格式,再怎么压,压缩比也不高,选择“储存”可以提高压缩速度,特别是文件体积过大时。