第1章理解數據質量1
●1.1數據質量問題2
1.1.1數據質量帶來的影響2
1.1.2影響數據質量的因素4
●1.2數據質量概述7
1.2.1數據質量定義7
1.2.2大數據時代數據質量面臨的挑戰8
●1.3數據質量與信息質量10
1.3.1從數據質量到信息質量的發展歷程11
1.3.2數據質量與信息質量的區別與聯系12
參考文獻14第2章數據質量標準17
●2.1ISO 8000國際標準18
2.1.1ISO 8000的歷史與現狀18
2.1.2ISO/TS 8000100系列概述20
2.1.3ISO/TS 8000100主數據質量22
2.1.4ISO 22745: 2010概述24
●2.2地理信息質量標準ISO 1910028
2.2.1地理信息數據質量31
2.2.2地理信息數據質量評價33
●2.3統計數據質量標準35
2.3.1國際統計數據標準概述35
2.3.2IMF的數據公布通用標準(GDDS)36
2.3.3IMF的數據公布特殊標準(SDDS)38
●2.4科學數據質量標準39
2.4.1科學數據標準規范39
2.4.2科學數據質量框架43
參考文獻44第3章數據分類及數據模型47
●3.1數據類型及分類48
3.1.1數據類型48
3.1.2數據分類49
●3.2結構化數據模型51
3.2.1概念模型51
3.2.2邏輯模型53
●3.3半結構化和非結構化數據模型56
3.3.1XML語言57
3.3.2半結構化數據模型——數據和數據質量(D2Q)模型67
3.3.3非結構化數據模型——四面體模型71
參考文獻79第4章數據質量相關技術81
●4.1數據集成82
4.1.1數據倉庫的基本概念82
4.1.2數據倉庫的體系架構83
4.1.3數據倉庫的元數據87
●4.2數據剖析89
4.2.1數據剖析的方法89
4.2.2數據剖析實例92
●4.3數據清潔95
4.3.1數據清潔概述95
4.3.2“臟”數據的來源96
4.3.3數據清潔的原理與框架97
4.3.4數據清潔工具100
4.3.5大數據環境下的數據清潔102
●4.4數據溯源105
4.4.1數據溯源的基本概念105
4.4.2數據溯源的分類106
4.4.3數據溯源模型107
4.4.4數據溯源的方法109
4.4.5數據溯源的應用111
4.4.6大數據溯源111
參考文獻115第5章數據質量評估121
●5.1數據質量維度122
5.1.1數據質量維度定義122
5.1.2常用的數據質量維度123
5.1.3其他的數據質量維度126
5.1.4質量維度度量127
●5.2數據質量評估框架130
5.2.1DQAF框架131
5.2.2AIMQ框架133
5.2.3DQA框架136
●5.3數據質量評估方法137
5.3.1定性評估137
5.3.2定量評估138
5.3.3綜合評估140
●5.4數據質量評估案例——媒體信息可信度質量評估152
5.4.1背景概述152
5.4.2媒體信息可信度評價指標體系153
5.4.3媒體信息可信度的綜合評價模型154
5.4.4實驗過程及結果分析160
參考文獻163第6章數據質量管理167
●6.1質量管理168
6.1.1質量管理發展歷程168
6.1.2全面質量管理170
●6.2數據質量管理概述171
6.2.1數據質量管理方法172
6.2.2數據質量知識庫管理173
6.2.3MIT全面數據質量管理175
●6.3數據質量管理團隊建設176
6.3.1任命首席數據官177
6.3.2建立數據質量管理團隊178
●6.4質量管理成熟度模型179
6.4.1信息質量管理成熟度模型180
6.4.2數據質量管理成熟度模型181
參考文獻184第7章位置大數據中的質量研究187