使用Microsoft Office Document Image Writer虛擬打印機(jī)
1、前提需要完全安裝Office2003-Office工具-Microsoft Office Document Imaging!一般默認(rèn)的office安裝沒(méi)有OCR識(shí)別文本功能!
完全安裝方法:在添加刪除程序里,選擇office2003,點(diǎn)擊更改,出現(xiàn)了office2003安裝修改界面,選擇-更改刪除-下一步-高級(jí)選項(xiàng)-office工具里找到Microsoft Office Document Imaging選擇從本機(jī)安裝(默認(rèn)的是“第一次使用時(shí)安裝”)-一路下去就ok了。接下來(lái)就可以體驗(yàn)office的文字識(shí)別功能了。
2、以最麻煩的超星文件為例。(建議安裝ssreader3.8版本,因?yàn)?.9版對(duì)虛擬打印有限制)
在3.8版本中使用虛擬打也需要一點(diǎn)前期工作,點(diǎn)擊控制面板-打印機(jī),列表中看到Microsoft Office Document Image Writer,重命名(避免一些writer等字眼,防止超星的禁止功能),命名數(shù)字即可,比如2。
打開(kāi)下載的超星文件,由于超星對(duì)書(shū)目錄和正文分別記錄頁(yè)數(shù),所以,如果要全部轉(zhuǎn)化,需要自己算一下頁(yè)數(shù)(目錄+正文最后頁(yè)碼既可)。然后選到開(kāi)始打印的頁(yè)面,選擇:圖書(shū)-打?。瓘漠?dāng)前頁(yè)開(kāi)始打印-打印頁(yè)數(shù)(自己計(jì)算的頁(yè)數(shù))-確定-選擇打印機(jī)中選擇剛才改名的 2 打印機(jī)-打印,然后彈出對(duì)話框選擇打印文件(.mdi)名字和存放路徑。保存完畢后mdi文件會(huì)被Microsoft Office Document Imaging程序自動(dòng)打開(kāi)。
3、在Microsoft Office Document Imaging打開(kāi)文件中選擇:工具-使用OCR識(shí)別文本。注意,如果一次打印的超星頁(yè)數(shù)較多,ocr識(shí)別會(huì)花較長(zhǎng)時(shí)間。以我的為例(670頁(yè),機(jī)器賽揚(yáng)D2.66G,512M內(nèi)存,耗時(shí)20分鐘左右;一般十幾頁(yè)也就幾十秒)。等待OCR識(shí)別完畢,選擇:工具-將文本發(fā)送到word-保存!大功告成!
其他:如果時(shí)pdf或caj文件,打開(kāi)文件后直接選擇:打?。蛴№?yè)數(shù)。。。等等同2、3步驟,就是如此簡(jiǎn)單。
后話:可能有人會(huì)懷疑office文字識(shí)別的準(zhǔn)確率,經(jīng)PDF文件轉(zhuǎn)換驗(yàn)證,比用PDF Converter等轉(zhuǎn)word工具還要準(zhǔn)確,而且不用注冊(cè),沒(méi)有垃圾信息。再說(shuō)了,微軟,大品牌,值得信賴:)
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。