PDF内容获取
其实 PDF 转 word 已经不算是什么新兴技术了,大约 10 年左右的时候,我在网上通过一些本地转换工具/在线转换工具,以及汉王OCR等软件,就已经可以把 PDF 导成 word 或者获取 PDF 文件中的绝大多数内容了。而随着软件技术的不断发展,最近的一些新兴软件在转换效率等上面也做的越来越出色,目前大多数的 PDF 文档几乎都可以完美转换成 word 格式。
在正文之前,首先安利一个 PDF 软件,国内出名的算是福昕阅读器了,该软件的特点就是速度快,占用资源少,功能多(虽然他也有很多缺点,但和同类 PDF 软件比已经可以甩开别人好几条街了)。这边就 PDF 中的内容获取,我们可以分为三类,以下针对他们也会一一详细介绍。
复制粘贴
并不是每个人都需要获取 PDF 文件中全部内容的,很多时候我们在阅读一个 PDF 文档时,也许只是需要摘录他的一句话,或者获取一小段文字。这个时候往往可以在 PDF 中直接选中这段文字,右击或使用快捷键复制。但往往有些人会特意为难我们,他们会在自己的 PDF 文件上面进行加密,让你只能阅读文件,却没法对文件内容进行任何复制,标注等操作。如果遇到这种问题,可以使用我这边提供的一个小工具,pdfunlocker,如果无法解密,可以去找新版的软件。。
这边介绍两个比较好用的 PDF 小工具:FreePic2Pdf+PdgCntEditor。解锁后的文件很多会丢失目录,可以通过软件 PdgCntEditor 获取文档目录编辑。同时 FreePic2Pdf 软件(批量将图片导出成 PDF 文档)可以和 PdgCntEditor 一起使用,