双层PDF

什么是双层PDF
“双层PDF”又称为“可检索式PDF”(searchablePDF),一般将其定义为“底层是扫描图像(Image)层,上层是透明文字(Text)层的PDF,阅读时看到的是与纸样一致的底层扫描图像,搜索或用光标选取时又可直接对上层文字进行操作。因其具有文字可检索的性质,可以在网络上进行在线检索,并通过建立索引数据库进行科学的管理,所以非常适用于网络期刊。万方和维普期刊数据库对用方正书版排版的期刊就是将样刊扫描后,经OCR识别生成Image-Text(图像-文本)型双层PDF文件以供下载。

优缺点
双层PDF的优点显而易见,既保留了原文件尤其是原图片的真实状态,又因为具有文本层,方便了数据管理和索引。缺点是双层PDF制作需要条件,手写体OCR识别率不高。

双层PDF的制作方法
通过OCR软件(如ABBYY)、PDF编辑软件(如Adobe Acroba)、扫描仪搭载软件,均可制作双层PDF。

此条目发表在Uncategorized分类目录。将固定链接加入收藏夹。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注