字元識別技術

字元識別(Optical Character Recognise,OCR)技術是指用於對紙上的印刷及列印文字字元進行識別,將識別結果以文本方式存儲在計算機器中。目前的印刷及列印文字字元識別軟體及設備能閱讀各類中西文字元,且準確率可達90%以上。通過字元識別軟體及設備可將書面上不可編輯的文檔及圖片轉換為可編輯內容。

OCR已經逐步進入了人們日常學習、生活、工作等各個套用領域。我們知道銀行的客戶存單一般都是進行圖像存檔,以前的存檔方法是通過微拍的方式,非常耗時、耗力。現在通過OCR技術,就可以在通過掃瞄器對存單進行掃描,通過OCR技術對存單的關鍵欄位進行識別,然後進行索引、存入光碟,極大地方便了查找。從上面套用中我們不難發現,只要涉及表格、文字方面的信息處理,OCR就會很好的發揮優勢。因此,保險公司的保單,超市的進貨單,增值稅發票、甚至人大代表的選票也都可以用OCR進行識別,而且識別率相當高。
在今後的若干年內,以紙為基礎的辦公檔案仍將會繼續大量存在,字元識別技術會發揮很重要的作用,並大大提高信息處理系統的工作效率。

相關詞條

熱門詞條

聯絡我們