OCR識別簡單的說就是把圖像格式的文字分析為純文字,可編輯。 OCR是英文Optical Character Recognition的縮寫,意思為光學字符識別,通稱為文字識別,它的工作原理為通過掃描儀或數碼相機等光學輸入設備獲取紙張上的文字圖片信息,利用各種模式 識別算法分析文字形態特征,判斷出漢字的標準編碼,并按通用格式存儲在文本文件中,由此可 以看出,
OCR實際上是讓計算機認字,實現文字自動輸入。掃描文件可以使用OCR文字識別軟件轉換為文本文件,再插入Word進行編輯,有的OCR文字識別軟件可以直接保存為Word文檔。它是一種快捷、省力、高效的文字輸入方法。
OSR識別的好處:
1. 直接提取圖片文字的信息,減少手工輸入文字的次數。
2. 節約錄入時間,減輕工作量,提高工作效率。
OCR的應用:
目前市面上有OCR識別軟件出售,但是只是購需要一筆不少的費用,很多人也不愿意去購買。大多一部份人還是自己照著圖紙打字。市面上還有一些辦公產品是自帶有OCR識別功能的,比如說掃描儀軟件。只需要購買掃描儀,就可以得到一款既有OCR識別的軟件,這是很明智的選擇。
市面上現在大多都采用拍攝式掃描儀,這類的軟件是具備OCR識別功能的。但是OCR識別率對圖片里的文字是有一定要求的。圖像的像素必須是500萬(2592X1944)以上,文字6Pt以上的正楷字。手寫的文字以及草書、行書是無法識別的。下面簡單介紹以下鼎易數影儀旗艦版的OCR識別功能。
凡是購買數影儀的用戶,都可以使用鼎易旗艦版軟件OCR識別功能。此款軟件可以導入電腦中的任意一張圖片,進行識別,識別率根據圖片像素和圖片里文字的大小來定,一般識別率可達96%,如果是英文,字體清晰,識別率可達99%。在軟件里面,可以有選擇性的識別。用戶可以選擇需要識別的段落文字,進行識別。識別后,軟件可自動對不確定的文字進行標注,方便用戶檢查糾正。這款軟件深受行業客戶的歡迎和親睞。
[1]