其实 PDF 转 word 已经不算是什么新兴技术了,大约 10 年左右的时候,我在网上通过一些本地转换工具/在线转换工具,以及汉王OCR等软件,就已经可以把 PDF 导成 word 或者获取 PDF 文件中的绝大多数内容了。而随着软件技术的不断发展,最近的一些新兴软件在转换效率等上面也做的越来越出色,目前大多数的 PDF 文档几乎都可以完美转换成 word 格式。

在正文之前,首先安利一个 PDF 软件,国内出名的算是福昕阅读器了,该软件的特点就是速度快,占用资源少,功能多(虽然他也有很多缺点,但和同类 PDF 软件比已经可以甩开别人好几条街了)。这边就 PDF 中的内容获取,我们可以分为三类,以下针对他们也会一一详细介绍。

复制粘贴

并不是每个人都需要获取 PDF 文件中全部内容的,很多时候我们在阅读一个 PDF 文档时,也许只是需要摘录他的一句话,或者获取一小段文字。这个时候往往可以在 PDF 中直接选中这段文字,右击或使用快捷键复制。但往往有些人会特意为难我们,他们会在自己的 PDF 文件上面进行加密,让你只能阅读文件,却没法对文件内容进行任何复制,标注等操作。如果遇到这种问题,可以使用我这边提供的一个小工具,pdfunlocker,如果无法解密,可以去找新版的软件。。

这边介绍两个比较好用的 PDF 小工具:FreePic2Pdf+PdgCntEditor。解锁后的文件很多会丢失目录,可以通过软件 PdgCntEditor 获取文档目录编辑。同时 FreePic2Pdf 软件(批量将图片导出成 PDF 文档)可以和 PdgCntEditor 一起使用,

文字转成 word

虽然计算机发展了很多年,但仍然有不少人会使用 word 来进行排版和编辑。他们也希望所有获得的文档都是 word 类格式(包括 .doc .docx等等)的,这样他们就可以对文档中的内容进行任意的增删改查了,虽然说 PDF 出现就是为了规范格式,让一般人无法轻易的对其中的内容做修改,但仍然有很多人乐此不疲的想这么做。PDF 转 word 的软件可以说是相当繁多且良莠不齐,这边我们只推荐一款: PDF-to-Word 该软件网上很容易找到,这边就不给出链接了,当然其他还有很多可以将 PDF 转成 word 的工具,如在线网站 smallpdfnitropdf等等。

图片转 word

并不是所有的 PDF 都可以轻易转成 word,以上那类 PDF 转 word 的软件,很多都只适用于文字的转换,换言之,就是本来文字内容你就是可以选择的,软件要做的只是讲文字内容自动复制出来,进行重新排版,然后生成 word 文件给你看。但现在很多 PDF 文件的内容都不是文字格式的,很多内容是扫描件,或者是手工拍的照片,更有胜者将文字转成了图片在导入到 PDF 中。这些无疑都增加了你导出内容的难度,然而,这些问题也只能难道过去你的,对 OCR 技术如此成熟的今天,只要不是手写内容,基本上都可以 100% 的识别出来。下面我们介绍下几款这种软件:

  • 汉王 OCR:好像是 05 的一款软件,国内比较早涉及这款领域的一个软件,识别率不是很高,但也基本可以识别,优点是不要联网,可以离线直接使用。
  • Google drive:你可以把 Google 邮箱中的内容直接通过 Google drive 打开,右击 PDF 用 word 打开,然后你会惊奇的发现,PDF 中图片的内容已经变成了可以编辑的文字了。目前而言,Google drive 中的 PDF 插件是用户体验最好的一种方式,几乎可以满足所有的 PDF 转 word 编辑,然而使用该服务需要联网,因此你需要科学上网。
  • oneNote:Microsoft office 全家桶中的一员大将,oneNote 中自带 OCR 功能,你可以在插入中找到找到它,这个软件 windows 7 中好像是没有的,其他最新系统到底面不免费就不得而知了。
  • WPS:该软件大家应该也比较熟悉,算是国内 office 软件的霸主了。用 WPS 打开你的 PDF 文档,最上方就会出现 word 转 pdf 的选项,以及图片转文字功能,对于辨识度较高的图片常规读取里面的内容是没问题,但该功能算是 WPS 的一个增值服务,如果需要转成 word 或者识别度好,则是需要会员服务的。

小结

以上这些软件都是一看就会用的软件,这边不再具体给出软件的教程,如有疑问可以自己多尝试,或者直接网络搜索。


写作时间:21:00-22:08