如何将caj格式Pdf格式转化为Word文件 caj格式Pdf格式转word详细教程
发布时间:2022-12-04 19:34:46
从中国文献网、期刊网、中国知网等下载的资料大多是caj、kdh等格式,只能使用cajviewer查看,不能被修改编辑
从中国文献网、期刊网、中国知网等下载的资料大多是caj、kdh等格式,只能使用cajviewer查看,不能被修改编辑。网上提供了许多处理这种情况的软件,但是大多数处理效率极低。本文将介绍给大家一个简便、快捷将caj、kdh、pdf等文件转换为word的方法。
工具/原料
CAJViewer 7完整版 (带OCR组件)
PDF虚拟打印机(本文以PDF factory 为例)
OCR识别软件 (本文以ABBYY finereader 9为例)
很多科技文献,论文,都是用 CAJViewer7.0 称为“电子阅读器”的一个程序来阅读的。
但CAJ 文件像 PDF 文件一样,是些类似图片格式的文本。这些图片格式的文本转换成可编辑的真正文本是有点麻烦的。仅仅用“拷贝,粘贴”的办法,是不行的。需要进行一个格式的转换。
需要安装一个软件:Office
用 CajViewer 打开所要转的文件,工具栏里选“文件”-“打印”
一般机器里安装了Office 之后,会随着安装一个虚拟打印机 Microsoft Office Document Imaging,就选择打印到这个虚拟打印机上。
先选打印“全部”,然后点“确定”。最后选择文件保存路径,但这时,保存的这个文件是 MDI 格式的,打印完后 Microsoft Office Document Imaging 会自动打开你刚才保存的文件。然后在工具栏里选择“工具”-“将文本发送到Word” 这样就可以把 CAJ 格式的文件转变称为 WORD 格式了。
步骤/方法
1、用CAJviewer 7打开你要转换的文件,如下图所示如果我们需要第一段的内容,那么我们需要点击CAJViewer 7自带的OCR功能键,如下图图中红色方框框出的按钮就是OCR识别按钮(如果你使用的是精简版的CAJviewer,那么这个按钮是灰色的,不可用的),我们点击一下鼠标就会变成十字形,然后我们在当前页面上框选出需要的内容,稍等一会儿就会弹出一个识别文字的方框,我们可以选择复制到剪贴板或者发送到word,然后关闭这个识别框就可以了。(OCR识别是有错误率的,所以识别后我们需要人工校对)如果我们只需要摘录一小部分内容的话,那么我们用这个方法就可以了,如果想整篇文章都转换成可以编辑的word格式的话,那么我们继续往下看。
2、这一步我们的思路是将CAJ、KDH、NH文件转换成PDF,然后再将pdf转换成word格式的方法来转换。那么我们需要现将这样的文件转成PDF格式。推荐使用PDF虚拟打印机,本文以PDF factory 为例。(PDF Craetor或者foxit 系列软件的PDF虚拟打印机可能和CAJviewer 有冲突,转换出来的PDF只有上半页面,下半个页面是空白的,所以我这里不推荐大家使用)CAJviewer 软件菜单 文件----打印------弹出打印界面如上设置 ,如果你用的是其他的PDF虚拟打印机,选择相应的打印机即可,其他基本上默认就可以,点击确定,等待转换,然后保存为PDF文件。
3、接下来我们的任务就是把转换好的PDF文件转成WORD,那么这里我们使用ABBYY finereader这款强大的PDF转换软件来进行OCR转换。(因为从CAJviewer转换过来的PDF文件是图片形式的PDF文件,所以用其他的PDF转word软件是无能为力的,必须要带有OCR功能的转换软件才可以,这点请大家务必记住。)我们运行ABBYY finereader软件,设置好识别文件的语言种类(可以是多种的)如果不想软件打开是显示该页面,可以勾选“不在显示此窗口”选项,打开刚才保存的PDF文件,文件自动进行OCR识别。
4、识别过程中如果有无法识别部分或者错误,软件有警告提示的。识别完毕后,软件菜单文件------另存为-------Microsoft word文档 保存即可。
5、保存以后的WORD文件我们用软件打开看一下,转换效果如下图所示:转换的效果基本上还是可以的,版面的还原能力也不错,剩下的事情就是自己要和原文校核一下,大功告成~~~。
注意事项
文件最后的转换效果和你所用的PDF虚拟打印机的转换效果有直接的关系,转换成的PDF文件清晰度越高,最后OCR识别的准确率越高。
如果你的文件中间包含有大量的数学公式、物理公式、三角函数、各种计算式目前还不能够被识别,所以这些都需要我们自己用公式编辑器手动输入,这个也是目前最遗憾的事情。


猜你喜欢
- 通常编辑文档或者查看文档都会使用Word打开。在Word使用过程中,小编发现了一个很好用的功能,可以将多个文档合并在一起,而且被合并的文档并
- 如何在Word 2013中设置段落格式的技巧?在段落级别,Word 2013中的自动套用格式可帮助您快速处理其他一些令人讨厌的格式设置问题。
- ①启动PowerPoint2010,打开幻灯片,然后单击文件--选项。 ②在PowerPoint选项中,单击保存,
- 我们在制作某个演示文稿的时候,如果要引用其他演示文稿中的部分幻灯片,可以这样操作:执行“插入→幻灯片(从文件)”命令,展开“幻灯片搜索器”对
- 有不少用户使用EasyBoot(EZBoot)制作系统启动盘,发现EZboot不能完美支持超过4G的单个文件。当ISO镜像中有大于4G的单个
- word分页符在哪?请看下文使用分页符换页的方法。在学习换页之前,我们先来了解下分页符。分页用于对文档页面的排版控制,一个文档中可以有几个不
- 在excel表格中,饼图能够显示出每个项目的占比,但是这种类型的图表是怎么制作的呢?下面随小编一起来看看吧。excel制作饼图的步骤首先打开
- 本周早些时候,微软向快速Insider会员推送了Windows 10 build 10565,这个版本引入了一些新功能。今天,Windows
- miui12上市后,很多的米粉都已经迫不及待的下载了内测版,但是内测版是最早的版本所以有着很多的bug,很多小伙伴都想要降级,那么该怎么操作
- 优优云打码助手怎么用?优优云打码助手是一款非常不错的uu打码平台专用工具,有些刚下载该软件的用户,还不太了解这款软件的功能和使用,下面就给大
- 本篇文章小编为大家介绍,Windows 8技巧:第一个拆分布局应用程序修改Logo的方法介绍 。需要的朋友参考下在VS2012中新建一个拆分
- 很多的用户们在重装完系统以后,就会遇到各种各样的问题,比如说这个重装以后,电脑没有声音了,无法进行任何播放设置,这该怎么办呢,快来看看详细的
- 自从Win10正式版7月29号发布TH1版后,11月10日又推出了TH2版的更新,TH2的版本号从10240升级到了10586。有些用户已经
- excel sum是什么意思?在excel中,sum是求和的意思,将目标参数进行求和操作。下面以A1:A5求和为例。验证如下:1、打开EXC
- 很多朋友不清楚word2016怎么自动滚屏?下面小编给大家带来word2016自动滚动页面方法,需要的朋友可以参考下有时候在阅读一篇很长的W
- 有部分用户在使用win7的过程中经常出现死机的现象,对此表示很无奈,那么win7经常死机怎么办呢?据小编所知,win7经常死机故障问题所造成
- Win7是很经典的电脑操作系统,有很多朋友到现在还在用,但是也有些朋友会遇到桌面文件名乱码的问题,想要知道如何解决,系统部落小编专门解答有关
- NIS(NVIDIA Image Scaling)技术本质是通过降低分辨率,并在显示时使用GPU放大及锐化来提高游戏帧率,即加速游戏并降低硬
- FlawlessApp for Mac是一款可以帮助iOS开发人员在iOS模拟器中比较预期设计和真实应用程序的工具。打开 iOS 模拟器后,
- 我们在使用钉钉进行日常办公的时候,有的小伙伴们可能因为一些情况需要删除自己的考勤记录。那么对于手机钉钉打卡考勤怎么删除记录这个问题小编觉得我