用PDF軟件先把PDF文件轉成圖片,然后再用OCR軟件識別。OCR全名叫Optical Character Recognition,說白了就是把圖片上的字識別出來,變成可編輯的文字文件。TXT文件就是最基礎的文本格式,不帶格式、顏色這些信息。
OCR的作用就是把圖片里的文字識別出來,保存成TXT這種可以修改的格式。因為圖片上的字其實是像素點,沒法直接改。用了OCR就能搞定,省得你一個字一個字地敲。比如你把報紙掃描成JPG圖片,OCR就能幫你把上面的文字提取出來,存成TXT,超級方便。
準確率一般能到95%左右,具體還得看原圖質量。常見OCR軟件有尚書七號、清華紫光文通、ScanSoft、TextBridge、Presto這些。
我的回答都是自己電腦經驗和網上整理的資料,不介意大家抄或者轉發,但最好注明出處,我也算沒白寫這么多字,謝謝理解!
OCR的作用就是把圖片里的文字識別出來,保存成TXT這種可以修改的格式。因為圖片上的字其實是像素點,沒法直接改。用了OCR就能搞定,省得你一個字一個字地敲。比如你把報紙掃描成JPG圖片,OCR就能幫你把上面的文字提取出來,存成TXT,超級方便。
準確率一般能到95%左右,具體還得看原圖質量。常見OCR軟件有尚書七號、清華紫光文通、ScanSoft、TextBridge、Presto這些。
我的回答都是自己電腦經驗和網上整理的資料,不介意大家抄或者轉發,但最好注明出處,我也算沒白寫這么多字,謝謝理解!