用ABBYY FineReader這個(gè)OCR識(shí)別軟件挺不錯(cuò)的。現(xiàn)在最新版是ABBYY FineReader 12專業(yè)版,支持100多種語(yǔ)言,連一些編程語(yǔ)言都能識(shí)別。有這么好用的工具,咱當(dāng)然得把它用到位,下面我就簡(jiǎn)單說說怎么用ABBYY把PDF轉(zhuǎn)成可編輯的文檔。
工具準(zhǔn)備:
ABBYY FineReader 11 專業(yè)版
操作步驟:
首先打開你要轉(zhuǎn)換的PDF文件,看看里面有沒有多種語(yǔ)言、表格或者圖片這些內(nèi)容。
然后運(yùn)行ABBYY FineReader 11,在歡迎界面點(diǎn)文檔語(yǔ)言的下拉菜單,選更多語(yǔ)言,彈出語(yǔ)言編輯器窗口,把你這個(gè)PDF里包含的語(yǔ)言都勾上。比如我這個(gè)文件里還有C++代碼,那就在里面找到C++也打個(gè)勾,設(shè)置好了就點(diǎn)右下角的確定。
回到主界面后,因?yàn)槲覀兪且裀DF轉(zhuǎn)成Word文檔,所以點(diǎn)擊中間那個(gè)文件(PDF/圖像)轉(zhuǎn)Microsoft Word。
接著會(huì)彈出選擇文件的窗口,挑你要轉(zhuǎn)換的PDF,注意左下角有幾個(gè)默認(rèn)勾上的選項(xiàng),如果不想要可以取消勾選,然后點(diǎn)打開。
ABBYY開始加載文件并自動(dòng)進(jìn)行OCR識(shí)別處理。如果你的PDF頁(yè)數(shù)比較多,可能要等一會(huì)兒,耐心點(diǎn)哈。
自動(dòng)識(shí)別有時(shí)候會(huì)有錯(cuò)別字或格式亂的情況,這時(shí)候就可以手動(dòng)修正了。你可以根據(jù)需要選擇不同的工具來(lái)調(diào)整,比如表格被識(shí)別成普通文字了,那就用表格工具選中表格區(qū)域,右鍵選擇讀取區(qū)域,重新識(shí)別成表格。
如果是帶文字的圖片被識(shí)別錯(cuò)了,可以用圖片工具框出圖片部分,這樣在識(shí)別其他文字的時(shí)候這塊就會(huì)保留為圖片了。
還有一個(gè)編輯圖像的按鈕,是用來(lái)對(duì)掃描圖片做預(yù)處理的。比如有些掃描頁(yè)會(huì)有點(diǎn)歪、對(duì)比度差或者變形,這時(shí)候先調(diào)一下圖像,能提高識(shí)別準(zhǔn)確率。處理完記得點(diǎn)右上角的退出圖像編輯器返回上一界面。
識(shí)別完成后,點(diǎn)菜單欄里的文件→將文檔另存為→Microsoft Word 文檔。如果你想保存成別的格式也可以選對(duì)應(yīng)的選項(xiàng),比如Excel啊、TXT啊啥的。
這軟件挺好用的,關(guān)鍵是要根據(jù)文件內(nèi)容設(shè)置好語(yǔ)言和識(shí)別區(qū)域,該自動(dòng)的自動(dòng),該手動(dòng)的就動(dòng)手改一改,效果會(huì)更好。
如果還想更高效一點(diǎn),可以把常用設(shè)置保存下來(lái),下次直接調(diào)用,省時(shí)間。大家有啥問題也可以留言一起討論~
工具準(zhǔn)備:
ABBYY FineReader 11 專業(yè)版
操作步驟:
首先打開你要轉(zhuǎn)換的PDF文件,看看里面有沒有多種語(yǔ)言、表格或者圖片這些內(nèi)容。
然后運(yùn)行ABBYY FineReader 11,在歡迎界面點(diǎn)文檔語(yǔ)言的下拉菜單,選更多語(yǔ)言,彈出語(yǔ)言編輯器窗口,把你這個(gè)PDF里包含的語(yǔ)言都勾上。比如我這個(gè)文件里還有C++代碼,那就在里面找到C++也打個(gè)勾,設(shè)置好了就點(diǎn)右下角的確定。
回到主界面后,因?yàn)槲覀兪且裀DF轉(zhuǎn)成Word文檔,所以點(diǎn)擊中間那個(gè)文件(PDF/圖像)轉(zhuǎn)Microsoft Word。
接著會(huì)彈出選擇文件的窗口,挑你要轉(zhuǎn)換的PDF,注意左下角有幾個(gè)默認(rèn)勾上的選項(xiàng),如果不想要可以取消勾選,然后點(diǎn)打開。
ABBYY開始加載文件并自動(dòng)進(jìn)行OCR識(shí)別處理。如果你的PDF頁(yè)數(shù)比較多,可能要等一會(huì)兒,耐心點(diǎn)哈。
自動(dòng)識(shí)別有時(shí)候會(huì)有錯(cuò)別字或格式亂的情況,這時(shí)候就可以手動(dòng)修正了。你可以根據(jù)需要選擇不同的工具來(lái)調(diào)整,比如表格被識(shí)別成普通文字了,那就用表格工具選中表格區(qū)域,右鍵選擇讀取區(qū)域,重新識(shí)別成表格。
如果是帶文字的圖片被識(shí)別錯(cuò)了,可以用圖片工具框出圖片部分,這樣在識(shí)別其他文字的時(shí)候這塊就會(huì)保留為圖片了。
還有一個(gè)編輯圖像的按鈕,是用來(lái)對(duì)掃描圖片做預(yù)處理的。比如有些掃描頁(yè)會(huì)有點(diǎn)歪、對(duì)比度差或者變形,這時(shí)候先調(diào)一下圖像,能提高識(shí)別準(zhǔn)確率。處理完記得點(diǎn)右上角的退出圖像編輯器返回上一界面。
識(shí)別完成后,點(diǎn)菜單欄里的文件→將文檔另存為→Microsoft Word 文檔。如果你想保存成別的格式也可以選對(duì)應(yīng)的選項(xiàng),比如Excel啊、TXT啊啥的。
這軟件挺好用的,關(guān)鍵是要根據(jù)文件內(nèi)容設(shè)置好語(yǔ)言和識(shí)別區(qū)域,該自動(dòng)的自動(dòng),該手動(dòng)的就動(dòng)手改一改,效果會(huì)更好。
如果還想更高效一點(diǎn),可以把常用設(shè)置保存下來(lái),下次直接調(diào)用,省時(shí)間。大家有啥問題也可以留言一起討論~