用ABBYY FineReader這個OCR識別軟件挺不錯的?,F在最新版是ABBYY FineReader 12專業版,支持100多種語言,連一些編程語言都能識別。有這么好用的工具,咱當然得把它用到位,下面我就簡單說說怎么用ABBYY把PDF轉成可編輯的文檔。
工具準備:
ABBYY FineReader 11 專業版
操作步驟:
首先打開你要轉換的PDF文件,看看里面有沒有多種語言、表格或者圖片這些內容。
然后運行ABBYY FineReader 11,在歡迎界面點文檔語言的下拉菜單,選更多語言,彈出語言編輯器窗口,把你這個PDF里包含的語言都勾上。比如我這個文件里還有C++代碼,那就在里面找到C++也打個勾,設置好了就點右下角的確定。
回到主界面后,因為我們是要把PDF轉成Word文檔,所以點擊中間那個文件(PDF/圖像)轉Microsoft Word。
接著會彈出選擇文件的窗口,挑你要轉換的PDF,注意左下角有幾個默認勾上的選項,如果不想要可以取消勾選,然后點打開。
ABBYY開始加載文件并自動進行OCR識別處理。如果你的PDF頁數比較多,可能要等一會兒,耐心點哈。
自動識別有時候會有錯別字或格式亂的情況,這時候就可以手動修正了。你可以根據需要選擇不同的工具來調整,比如表格被識別成普通文字了,那就用表格工具選中表格區域,右鍵選擇讀取區域,重新識別成表格。
如果是帶文字的圖片被識別錯了,可以用圖片工具框出圖片部分,這樣在識別其他文字的時候這塊就會保留為圖片了。
還有一個編輯圖像的按鈕,是用來對掃描圖片做預處理的。比如有些掃描頁會有點歪、對比度差或者變形,這時候先調一下圖像,能提高識別準確率。處理完記得點右上角的退出圖像編輯器返回上一界面。
識別完成后,點菜單欄里的文件→將文檔另存為→Microsoft Word 文檔。如果你想保存成別的格式也可以選對應的選項,比如Excel啊、TXT啊啥的。
這軟件挺好用的,關鍵是要根據文件內容設置好語言和識別區域,該自動的自動,該手動的就動手改一改,效果會更好。
如果還想更高效一點,可以把常用設置保存下來,下次直接調用,省時間。大家有啥問題也可以留言一起討論~
工具準備:
ABBYY FineReader 11 專業版
操作步驟:
首先打開你要轉換的PDF文件,看看里面有沒有多種語言、表格或者圖片這些內容。
然后運行ABBYY FineReader 11,在歡迎界面點文檔語言的下拉菜單,選更多語言,彈出語言編輯器窗口,把你這個PDF里包含的語言都勾上。比如我這個文件里還有C++代碼,那就在里面找到C++也打個勾,設置好了就點右下角的確定。
回到主界面后,因為我們是要把PDF轉成Word文檔,所以點擊中間那個文件(PDF/圖像)轉Microsoft Word。
接著會彈出選擇文件的窗口,挑你要轉換的PDF,注意左下角有幾個默認勾上的選項,如果不想要可以取消勾選,然后點打開。
ABBYY開始加載文件并自動進行OCR識別處理。如果你的PDF頁數比較多,可能要等一會兒,耐心點哈。
自動識別有時候會有錯別字或格式亂的情況,這時候就可以手動修正了。你可以根據需要選擇不同的工具來調整,比如表格被識別成普通文字了,那就用表格工具選中表格區域,右鍵選擇讀取區域,重新識別成表格。
如果是帶文字的圖片被識別錯了,可以用圖片工具框出圖片部分,這樣在識別其他文字的時候這塊就會保留為圖片了。
還有一個編輯圖像的按鈕,是用來對掃描圖片做預處理的。比如有些掃描頁會有點歪、對比度差或者變形,這時候先調一下圖像,能提高識別準確率。處理完記得點右上角的退出圖像編輯器返回上一界面。
識別完成后,點菜單欄里的文件→將文檔另存為→Microsoft Word 文檔。如果你想保存成別的格式也可以選對應的選項,比如Excel啊、TXT啊啥的。
這軟件挺好用的,關鍵是要根據文件內容設置好語言和識別區域,該自動的自動,該手動的就動手改一改,效果會更好。
如果還想更高效一點,可以把常用設置保存下來,下次直接調用,省時間。大家有啥問題也可以留言一起討論~