數據質量管理基礎

《數據質量管理基礎》是2016年1月由國防工業出版社出版的圖書,作者是劉瑞虹 賈西貝。

基本介紹

  • 書名:數據質量管理基礎
  • 作者:劉瑞虹 賈西貝
  • ISBN:978-7-118-10138-6
  • 頁數:229
  • 定價:69.0
  • 出版社國防工業出版社
  • 出版時間:2016年1月
  • 裝幀:精裝
  • 開本:32
目錄
第1章數據質量概述1
1.1數據質量管理1
1.2數據質量的核心問題3
1.2.1數據一致性3
1.2.2數據(去重)4
1.2.3數據精確性5
1.2.4信息完整性6
1.2.5數據時效性7
1.2.6數據質量問題之間的相互作用7
1.3基於規則的數據質量改進9
1.4背景介紹11
參考文獻註解12
第2章條件依賴14
2.1概述14
2.1.1條件函式依賴15
2.1.2條件包含依賴19
2.2條件依賴的靜態分析23
2.2.1可滿足性23
2.2.2蘊含性27
2.2.3有限公理化31
2.2.4依賴傳遞性35
參考文獻註解40
第3章基於條件依賴的數據清洗44
3.1發現條件依賴44
3.1.1CFD的發現問題44
3.1.2常量CFD的發現方法46
3.1.3發現通用CFD49
3.2錯誤檢測53
3.2.1單個CFD的SQL驗證法54
3.2.2驗證多個CFD規則55
3.3數據修復59
3.3.1數據修復問題60
3.3.2修復違反CFD和CIND規則的數據63
參考文獻註解74
第4章數據去重79
4.1概述79
4.2匹配依賴83
4.3匹配依賴的推理89
4.4記錄匹配的相對鍵91
4.5用於數據修復的匹配依賴98
參考文獻註解102
第5章信息完整性105
5.1相對信息完整性105
5.1.1部分封閉資料庫106
5.1.2相對信息完整性模型108
5.1.3相對完整性和數據一致性111
5.2判定相對完整性113
5.3可能世界的表示系統120
5.4捕獲丟失的元組和數值123
5.5基礎問題的複雜度125
參考文獻註解131
第6章數據時效性135
6.1數據時效性概述135
6.2數據時效性模型138
6.3數據時效性推理142
6.4融合複製函式147
6.4.1數據時效性模型的修訂148
6.4.2時效性保持的複製函式150
6.5時效性保持的判定152
參考文獻注釋156
第7章數據質量問題之間的相互作用158
7.1發現確定性修復158
7.1.1確定性修復概述159
7.1.2編輯規則161
7.1.3確定性修復和區域164
7.1.4發現確定性修復的框架167
7.1.5確定性修復的基礎問題169
7.2統一數據修復和記錄匹配172
7.2.1CFD和MD相互作用簡介173
7.2.2數據清洗問題和清洗規則175
7.2.3數據清洗框架178
7.2.4用CFD和MD進行數據清洗的靜態分析183
7.3消解衝突186
7.3.1衝突消解概述187
7.3.2衝突消解的模型189
7.3.3衝突消解的框架192
7.3.4衝突消解的基礎問題194
7.4綜述196
參考文獻註解198
附錄符號表202
參考文獻205"

相關詞條

熱門詞條

聯絡我們