中文信息處理技術

中文信息處理技術

本書以簡單、實用、易於理解為原則,內容力求全面、新穎,涵蓋了中文信息處理的主要相關技術和研究成果。讀者閱讀本書之後,能夠系統地了解漢字的編碼、字形壓縮與還原、光學漢字識別、中西文兼容處理、漢語自然語言處理等技術,以及中文信息處理技術的典型套用系統的原理與使用,如電子排版印刷系統、辦公自動化系統Internet搜尋引擎、智慧型檢索系統等,最終達到對中文信息處理技術的系統性了解。本書附錄中還提供了該領域常用的各項國家標準。

基本介紹

內容介紹,目錄,

內容介紹

本書以簡單、實用、易於理解為原則,內容力求全面、新穎,涵蓋了中文信息處理的主要相關技術和研究成果。讀者閱讀本書之後,能夠系統地了解漢字的編碼、字形壓縮與還原、光學漢字識別、中西文兼容處理、漢語自然語言處理等技術,以及中文信息處理技術的典型套用系統的原理與使用,如電子排版印刷系統、辦公自動化系統Internet搜尋引擎、智慧型檢索系統等,最終達到對中文信息處理技術的系統性了解。本書附錄中還提供了該領域常用的各項國家標準。
本書可作為大專院校計算機、信息管理系統工程等專業的本科教材,也可以供從事中文信息系統研發工作的科研人員參考。
-------

目錄

第1章 中文信息處理技術概論
1.1 信息處理的實質
1.1.1 信息和信息技術
1.1.2 文字信息處理
1.1.3 中文的文字信息處理的特點
1.2 漢字編碼的種類與中文信息處理過程中漢字編碼的變換
1.3 中英文兼容技術
1.4 ASCII體系的漢字內碼
1.4.1 概述
1.4.2 未占用C1區的編碼方式
1.4.3 覆蓋C1區的編碼方式
1.5 Unicode與Unicode漢字
1.5.1 背景
1.5.2 替代標準
1.5.3 方法與狀態
1.5.4 設計思想
1.5.5 Unicode字集
1.5.6 未來擴展與字元收錄
1.5.7 代碼賦值
1.5.8 細目
1.5.9 Unicode漢字
1.6 中文信息處理系統五層結構模型
1.7 中文信息處理技術發展概況
1.7.1 漢字標準代碼
1.7.2 漢字操作平台
1.7.3 漢字輸入方法
1.7.4 文字處理和文字編輯排版系統
1.7.5 中文信息檢索系統技術
1.7.6 翻譯系統技術
1.7.7 漢語自然語言理解
習題1
第2章 漢字編碼輸入原理
2.1 漢字和漢字屬性
2.1.1 漢字發展及其分級
2.1.2 漢字的結構分析
2.1.3 漢字的字音和字義
2.1.4 漢字的排序
2.1.5 漢字的屬性
2.2 漢字編碼輸入方法
2.2.1 概述
2.2.2 漢字鍵盤碼的笛卡兒積集分析
2.2.3 漢字信息的熵值
2.2.4 海曼公式與漢字編碼的鍵盤特性
2.2.5 漢字編碼輸入方法的簡易評測方法
2.2.6 漢字編碼輸入方法專業評測方法
2.2.7 漢字鍵盤碼的解碼問題
2.3 有關中文輸入技術現狀與發展的幾個問題
習題2
第3章 漢字字形存儲與壓縮技術
3.1 漢字字形存儲與字形碼
3.1.1 漢字字形的數位化
3.1.2 整字存儲與壓縮存儲
3.2 漢字壓縮存儲常見方法
3.3 衡量壓縮與還原技術的重要指標
3.4 漢字字形壓縮的方法與技術
3.4.1 漢字筆畫矢量存儲方法
3.4.2 部件組字壓縮方法
3.4.3 子信息塊哈夫曼樹壓縮
3.4.4 字形輪廓壓縮
3.4.5 黑白段與線性增量壓縮
3.4.6 筆畫輪廓壓縮
習題3
第4章 漢字識別技術
4.1 OCR技術概況
4.1.1 概述
4.1.2 漢字識別套用領域
4.1.3 印刷體文字識別的研究
4.2 漢字識別種類
4.3 漢字識別原理
4.4 漢字識別一般方法
4.4.1 印刷體文字識別研究方法簡介
4.4.2 在線上手寫文字識別研究方法
4.5 漢字識別產品介紹
4.5.1 漢王數位化檔案館解決方案概述
……
第5章 中西文兼容處理技術
第6章 漢語自然語言理解
第7章 中文信息處理技術的套用
附錄
參考文獻

相關詞條

熱門詞條

聯絡我們