開放文檔格式標準與互操作基礎

開放文檔格式標準與互操作基礎

本書以可擴展置標語言XML為核心,全面介紹了開放的文檔格式標準與文檔互操作理論及實踐。

基本介紹

  • 書名:開放文檔格式標準與互操作基礎
  • 作者:李寧、田英愛、侯霞 等
  • ISBN:9787302364672
  • 定價:79元
  • 出版社:清華大學出版社
  • 出版時間:2014.10.01
圖書信息,內容簡介,前言,目錄,

圖書信息

作者:李寧、田英愛、侯霞 等
定價:79元
印次:1-1
ISBN:9787302364672
出版日期:2014.10.01
印刷日期:2014.10.10

內容簡介

本書以可擴展置標語言XML為核心,全面介紹了開放的文檔格式標準與文檔互操作理論及實踐。其內容涵蓋了置標語言技術、文檔格式與相關標準、文檔處理技術、文檔互操作模型以及互操作性度量理論。此外,本書為方便讀者學習與研究,還介紹了相關領域的基本知識、技術現狀、研究成果以及未來發展方向等。
本書可作為高等院校計算機和信息技術相關專業的高年級本科生、研究生或教師的教材或學習資料,也可作為文檔格式標準、文檔處理技術、辦公自動化、信息系統建設等相關領域科研工作者的參考用書。

前言

文檔作為信息和知識的載體,已經深入到人類社會的每一個角落:私人信件、政府公文、商業信函、契約契約、歷史檔案、科學論文、產品手冊、媒體網頁、電子讀物……無一不是文檔。隨著數位化和網路的發展,如今信息處理已經逐漸從面向數據為中心的模式逐步發展到面向文檔為中心的模式。文檔信息處理技術涵蓋文檔的表示、編輯、轉換、存儲、檢索、發布、印刷、出版、數字著作權、數據流整合以及智慧型文檔等各個方面。近年來,人們尤為關注以XML為基礎的文檔信息的結構化表示、文檔格式的標準化與互操作、網路化辦公、文檔信息挖掘、語義網與智慧型文檔的結合等新的技術發展動向。
如今,辦公軟體已經成為人們日常最常用的軟體,產生了大量的辦公文檔。一些國家的政府組織發現,如果這些文檔以某個私有公司的文檔格式保存,那就意味著政府所有的公文都必須由該公司提供的軟體才可以打開,而且在向社會提供政府服務的時候,還要求被服務者只有購買某個特定公司的軟體才可以提供這種服務。作為政府公文,可能要保存很長時間,如果僅依賴一家廠商的產品,誰也無法保證這些文檔可以獲得持續的支持。這是很不合理的。
因此,美國麻薩諸塞州首先通過了必須採用開放文檔格式的政策,要求政府採購的軟體必須支持開放的文檔格式國際標準。這一政策得到了很大反響,包括美國其他州政府以及歐盟
、亞洲、非洲等很多國家都認識到這個問題的嚴重性,紛紛發布政策,確保政府公文應當採用開放文檔格式標準。
如今,有關文檔的開放標準在全世界越來越受到重視,聯合國、世界貿易組織、歐盟以及其他國家和地區都制定了相應的政策支持開放的格式標準。例如,歐盟20多年來一直致力於使用開放標準實現歐盟各國間文檔信息的互聯互通,曾經資助開發旨在方便應用程式間傳遞文檔的開放文檔體系結構標準(OpenDocumentArchitecture,ODA),該標準1985年成為ECMA標準,1994年前後成為國際標準化組織(InternationalStandardOrganization,ISO)標準(ISO/IEC8613)。2003年,歐盟又開展了對開放文檔格式標準和市場發展走向的調查,並提出一些評價開放文檔格式的準則。聯合國也在2005年指出,所有成員國和有關人員都應該有權訪問聯合國各機構以電子格式提供的公共信息,任何人都沒有義務為享有該權利而安裝特定的軟體。各機構應通過使用開放標準促進各ICT(Information&CommunicationTechnology)系統的互操作性,使人們無論使用何種軟體都可以打開相應格式的文檔。他們還應確保數據的編碼可以滿足公共電子記錄的持久性,而不依賴於特定的軟體提供商。一些國家(如英國)在2005年的電子政務互操作性框架中確定了以辦公套用XML規範為核心的互操作性需求。2006年,挪威就開始考慮在政府公文中採用開放的文檔格式標準ODF。2007年10月,丹麥政府向WTO(WorldTradeOrganization)正式通告《政府基於開放標準軟體採購的WTO聲明》,指出目前的研究表明,開放標準對於產業的發展和市場的競爭有積極的推動作用,要求從2008年起,所有的政府採購都必須基於ODF(OpenDocumentFormat)或OOXML(OfficeOpenXML)標準。其他國家,包括荷蘭、比利時、日本、南非和美國麻省州政府等國家和地區,都積極推動類似政策的制定和實施。
近年來順應開放文檔格式標準的呼聲,出現了一系列開放的國際國內標準。例如,2007年成為國際標準的ODF(ISO/IEC26300),2008年成為國際標準的OOXML(ISO/IEC29500)。
我國文檔信息處理的標準化工作開展得很早。2001年就開始了辦公軟體文檔格式國家標準的研製工作。2007年“標文通”(UniformOfficeFormat,UOF)正式成為我國國家標準,並得到各主流辦公軟體產品的廣泛支持。隨後“標文通”標準一直在不斷發展。“標文通”2.0草案已經於2010年年底完成。此外,我國正在制定面向電子公文的電子檔案存儲與交換格式標準,標準工作組已經確定將“標文通”2.0作為電子檔案的文書類流式文檔格式規範。
上述這些標準為文檔互操作創造了條件,但是離真正達到互操作的目標還有很長的路要走。
本書的作者是一批長期從事文檔信息處理的專家和學者,親身參加了近年各類主要的與文檔格式相關的國家標準的制定和套用推廣工作。儘管文檔信息處理是一個由來已久的研究方向,但是近年來文檔處理技術的研究又得到前所未有的重視。我們在研究和教學實踐中卻很少見到一部能夠全面反映近年文檔信息處理技術發展成就的專業書籍,我們深切感到出版這樣一部書的迫切性。恰逢2009年IBM公司將FacultyAward授予我們,給予我們寶貴的支持,於是我們幾位作者自不量力,開始了本書的編寫過程。經過4年的努力,終於得以付梓殺青。
本書的重點是開放的文檔格式與互操作。本書以可擴展置標語言XML為核心,圍繞文檔格式與互操作,介紹文檔信息處理的相關技術及其標準化狀況。本書的目的是使讀者了解相關領域的基本知識、技術發展以及最新成果。本書的讀者可以是大學與研究機構中信息技術相關專業的本科生、研究生和教師,以及從事文檔信息處理技術、辦公自動化、信息系統建設的技術人員和管理人員。
本書共分為9章。
第1章為概述,主要講解文檔技術的相關概念,文檔的分類,文檔相關標準的概況以及文檔處理技術的發展。
第2章為置標語言,主要介紹置標語言的概念與歷史,置標語言在開放文檔格式與文檔互操作中的作用,關於“所見即所得”與式樣內容分離的討論以及基於XML的文檔格式的設計方法。
第3章為文檔格式基礎,主要介紹流式文檔與版式文檔的主要區別,並分別介紹常見的流式辦公文檔及版式文檔格式,重點介紹流式辦公文檔的基本構成要素。
第4章為主要的辦公文檔格式標準,剖析主要的辦公文檔格式標準ODF、OOXML以及UOF,並對這3種主流的格式標準進行比較和分析。
第5章為其他文檔格式標準,較為詳細地介紹EPUB電子書格式標準,並簡單地對EPUB與其他電子書格式標準進行比較和分析;此外,還介紹一些其他的文檔格式規範,包括HTML(XHTML、HTML5)、XSLFO、MathML、SMIL、SVG等。
第6章為辦公軟體與文檔處理,介紹主要的辦公軟體產品、文檔的編輯處理與文檔編程,並簡單介紹文檔的自動化處理。
第7章為文檔處理關鍵技術,主要介紹文檔的一體化處理技術、跨媒體複合出版與互動、智慧型文檔技術、文檔安全與數字著作權技術、國際化與本地化技術、信息無障礙技術、基於文檔格式的文檔內容理解等技術;此外,還介紹了文檔處理技術的最新發展。
第8章為文檔互操作技術,主要介紹文檔互操作的概念、文檔互操作的需求、影響文檔互操作的因素、文檔互操作的實現途徑、文檔格式轉換工具及方法、文檔互操作模型、文檔互操作度量模型以及文檔互操作的保障。
第9章為當前標準化工作與未來發展,主要介紹ISO/IECSC34、OASIS、ECMA、W3C、標文通工作組、OpenOffice社區以及IBM等各大組織、機構、社團所開展的標準化工作,並勾勒出文檔信息處理和互操作技術的未來。

目錄

第1章概述
1.1文檔的概念及分類
1.1.1文檔的概念
1.1.2文檔的分類
1.2文檔格式與標準化
1.3文檔技術及其發展
1.4開放的文檔處理與互操作
參考文獻
第2章置標語言
2.1置標語言的概念與歷史
2.1.1通用標記語言GML
2.1.2標準通用置標語言SGML
2.1.3可擴展置標語言XML
2.2置標語言在開放文檔格式與文檔互操作中的作用
2.3關於“所見即所得”與式樣內容分離的討論
2.4基於XML的文檔格式的設計方法
2.4.1做好需求分析,保證文檔格式適合套用的要求
2.4.2儘量重用已有的標準
2.4.3儘量規避私有的標準
2.4.4讓已有的文檔格式逐步過渡到新的格式
2.4.5置標體現內容與式樣分離的原則
2.4.6置標人機可讀
2.4.7設計最易兼容的文檔格式
2.4.8適當處理好非XML內容
參考文獻
第3章文檔格式基礎
3.1流式文檔與版式文檔
3.2常見的辦公文檔
3.2.1文字處理文檔
3.2.2電子表格文檔
3.2.3演示文稿文檔
3.3辦公文檔的基本要素
3.3.1元數據
3.3.2連結與書籤
3.3.3腳註與章節附注
3.3.4文本和字元
3.3.5段落
3.3.6表格
3.3.7列表
3.3.8標題
3.3.9目錄與索引
3.3.10圖表
3.3.11多媒體對象
3.3.12式樣
3.3.13頁面布局
3.3.14修訂與批註
3.3.15幻燈片中的動畫
3.4常見的版式文檔
3.4.1 PDF/Mars
3.4.2 CEBX
參考文獻
第4章主要的辦公文檔格式標準
4.1 ODF
4.1.1標準概述
4.1.2字處理文檔
4.1.3電子表格文檔
4.1.4演示文稿文檔
4.2 OOXML
4.2.1標準概述
4.2.2文字處理文檔
4.2.3電子表格文檔
4.2.4演示文稿文檔
4.3 UOF
4.3.1標準概述
4.3.2字處理文檔
4.3.3電子表格文檔
4.3.4演示文稿文檔
4.4主流文檔格式標準的分析與比較
4.4.1打包方式
4.4.2式樣的描述
4.4.3字處理文檔
4.4.4電子表格文檔
4.4.5演示文稿
4.4.6小結
參考文獻
第5章其他文檔格式標準
5.1電子書格式標準
5.1.1 EPUB
5.1.2其他主要電子書格式標準及其比較
5.2其他文檔格式規範
5.2.1HTML
5.2.2XSLFO
5.2.3MathML
5.2.4SMIL
5.2.5SVG
5.2.6其他格式標準
參考文獻
第6章辦公軟體與文檔處理
6.1概述
6.2主要的辦公軟體產品
6.2.1 OpenOffice.org
6.2.2 IBM Lotus Symphony
6.2.3 Microsoft Office
6.2.4國產辦公軟體
6.2.5主要辦公軟體對平台和格式標準的支持
6.2.6其他文檔處理工具
6.3文檔的編輯
6.3.1文字處理文檔的編輯
6.3.2電子表格文檔的編輯
6.3.3演示文稿文檔的編輯
6.4文檔的編程
6.4.1使用辦公軟體提供的SDK
6.4.2使用文檔格式API及SDK
6.4.3使用XML套用編程接口
6.5文檔的自動化處理
參考文獻
第7章文檔處理關鍵技術
7.1文檔一體化處理技術
7.1.1複合文檔技術
7.1.2流式文檔與用戶數據的結合
7.1.3版流一體化技術
7.2跨媒體複合出版與互動
7.2.1複合出版技術
7.2.2文檔對多媒體內容的支持
7.3智慧型文檔技術
7.3.1早期的文檔自動化技術
7.3.2智慧型標籤技術
7.3.3智慧型表單技術
7.3.4智慧型文檔處理模型
7.4文檔安全與數字著作權技術
7.4.1辦公文檔的安全保障機制
7.4.2文檔標識方法
7.4.3數字著作權保護技術
7.5國際化與本地化技術
7.5.1文檔處理國際化、本地化面對的問題
7.5.2國際化、本地化文檔處理技術
7.6信息無障礙技術
7.6.1信息無障礙的概念
7.6.2文檔處理的信息無障礙要求
7.7基於格式的文檔內容理解
7.7.1文檔格式對於內容理解的重要性
7.7.2基於格式的文本信息抽取與分類
7.7.3文檔格式校驗
7.8文檔處理技術的新發展
7.8.1線上辦公系統
7.8.2雲計算環境下的文檔協同
7.8.3雲計算帶來出版業的變革
參考文獻
第8章文檔互操作技術
8.1文檔互操作的概念
8.2文檔互操作的需求
8.3影響文檔互操作的因素
8.4文檔互操作的實現途徑
8.4.1制定完善的標準
8.4.2文檔格式轉換
8.4.3開發文檔模板
8.4.4採用套用編程接口
8.4.5基於語義的互操作
8.4.6其他互操作途徑
8.4.7 IBM互操作觀點
8.5文檔格式轉換
8.5.1常見的文檔格式轉換工具
8.5.2辦公文檔格式轉換方法
8.5.3辦公文檔格式轉換項目
8.6互操作模型
8.7文檔互操作度量模型
8.8文檔互操作的保障
參考文獻
第9章當前標準化工作與未來發展
9.1當前的研究工作
9.1.1國際標準化組織ISO/IEC JTC1 SC34的相關工作
9.1.2 OASIS的相關工作
9.1.3 ECMA的相關工作
9.1.4 W3C的相關工作
9.1.5 “標文通”工作組的相關工作
9.1.6 OpenOffice.org的工作
9.1.7 IBM的互操作努力
9.2未來展望
參考文獻

相關詞條

熱門詞條

聯絡我們