尚書7號ocr文字識別系統完全版

基本信息

v　中文名: 尚書7號OCR文字識別系統完全版

英文名: Shocr

版本: Shocr7.0,Shocr6.0

發行時間: 2005年10月30日

製作發行: 北京漢王科技有限公司地區: 大陸

軟體介紹

目前，許多信息資料需要轉化成電子文檔以便於各種套用及管理，但因信息數位化處理的方式落後，不但費時費力，而且資金耗費巨大，造成了大量文檔資料的積壓，因此急需一種快速高效的軟體系統來滿足這種海量錄入需求。本軟體系統正是適用於個人、小型圖書館、小型檔案館、小型企業進行大規模文檔輸入、圖書翻印、大量資料電子化的軟體系統。

●識別字元

簡體字元集：國標GB2312-80的全部一、二級漢字6800多個。

純英文字元集。

簡繁字集：除了簡體漢字外，還可以混識台灣繁體字5400多個以及香港繁體字和GBK漢字。

●識別字型種類

能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字型，並支持多種字型混排。

● 識別字號

初號小六號字型。

●表格識別

可以自動判斷、拆分、識別和還原各種通用型印刷體表格。

●可支持繁體WINDOWS系統

首先，尚書七號開始將整個OCR的過程，明確化了，通過程式的選單，我們就能夠知道整個OCR的過程，主要分為：“檔案”、“編輯”、“識別”、“輸出”等步驟。

在檔案選單中，您可以調用掃瞄器，或者選擇將已經掃描好的圖像檔案打開。得到圖像檔案後，用戶開始的工作，就是“編輯“選單裡面所提示的：圖像頁面的處理，其中包括圖像頁的傾斜校正（提供自動和手動實現方法），旋轉等功能。

處理完畢後，就可以進入“識別過程”，該過程關鍵的是“版面分析”，現在尚書七號的自動版面分析功能很強，面對報紙雜誌等複雜情況的版面，也是分析的正確率很高。不再需要我們在尚書六號裡面那樣的建議手工劃識別範圍。也正是這點，大大降低了使用者的工作量。為了方便，“識別”選單下，也提供了用戶自己在自動版面分析後，通過修改識別範圍框的屬性，來決定需要識別否的功能（默認的情況下，圖象屬性的欄目是不用識別的。當然，如果用戶還是習慣原來尚書六號那樣，自己來設定識別區域，只要直接用滑鼠劃框就可以了。接下來，用戶就可以直接選擇“開始識別”的按鈕了，等待識別的結果。

使用方法介紹

一、掃瞄器驅動程式請切換到高級控制臺狀態

為了得到較好的OCR使用效果，建議用戶將掃瞄器的驅動SCANWIZARD 5軟體，由初始安裝的標準控制臺，切換到高級控制臺狀態。其切換的方法，如下圖所示。

二、第一次使用尚書OCR7號軟體

1．尚書7號OCR軟體是MICROTEK中晶科技公司，向漢王科技購買授權，贈送給用戶使用的軟體，該軟體是放在了掃瞄器隨機的驅動光碟中，用戶可以選擇安裝。

尚書7號ocr文字識別系統完全版

基本介紹

基本信息

軟體介紹

使用方法介紹

相關詞條

熱門詞條