《圖分析與可視化:在關聯數據中發現商業機會》是2016年3月由機械工業出版社出版的一本圖書。
基本介紹
- 書名:圖分析與可視化:在關聯數據中發現商業機會
- ISBN:9787111526926
- 出版社:機械工業出版社
- 出版時間:2016年3月1日
內容簡介,作者簡介,圖書目錄,
內容簡介
圖的作用是表示兩種事物之間的連線,揭示數據中關係的結構和本質。關係是理解事物“為什麼”以及“如何做到”的基礎,這也是圖分析和可視化具有巨大價值潛力的原因之一。圖的套用是一種獨特而寶貴的資源,可以將商業中的數據串點成線,形成深刻的認識來指導行動。本書由資深數據可視化專家撰寫,*面、系統地講解圖分析與可視化的有效原則與技術,並詳細介紹如何把圖的可視化與分析套用到商業中。
*書分為四部分,共16章。*一部分(第1章和第2章)概述圖的概念、類型及其在各領域的套用;第二部分(第3~8章)詳細講解如何獲取原始數據,並將其轉換為對圖形數據集進行的富有洞察力的互動分析;第三部分(第9~13章)討論不同類型的圖及其適用的分析;第四部分(第14~16章)探討圖技術和工具研發的前沿,以及圖設計的核心原則。
*書分為四部分,共16章。*一部分(第1章和第2章)概述圖的概念、類型及其在各領域的套用;第二部分(第3~8章)詳細講解如何獲取原始數據,並將其轉換為對圖形數據集進行的富有洞察力的互動分析;第三部分(第9~13章)討論不同類型的圖及其適用的分析;第四部分(第14~16章)探討圖技術和工具研發的前沿,以及圖設計的核心原則。
作者簡介
Richard Brath
數據可視化的積*實踐者和先行者,為一些世界級大公司和**軟體供應商提供數據可視化和視覺分析方面的研究、設計、開發服務。他創建的解決方案範圍很廣,從用於移動設備的豐富的互動式可視化,到用於商業套用的多點觸控、多螢幕裝置以及基於Web的分析可視化。
David Jonker
Uncharted(原來的Oculus Info Inc)公司的聯合創始人和高級合伙人。他既是設計師也是開發者,為基於Web的、分散式的、桌面的和移動的套用設計可視化分析工具和平台。他曾為位於時代廣場的NASDAQ MarketSite實時廣播中心創建可視化產品,目前是DARPA XDATA項目的帶頭人,開發一些新的工具和技術來幫助理解大數據。
數據可視化的積*實踐者和先行者,為一些世界級大公司和**軟體供應商提供數據可視化和視覺分析方面的研究、設計、開發服務。他創建的解決方案範圍很廣,從用於移動設備的豐富的互動式可視化,到用於商業套用的多點觸控、多螢幕裝置以及基於Web的分析可視化。
David Jonker
Uncharted(原來的Oculus Info Inc)公司的聯合創始人和高級合伙人。他既是設計師也是開發者,為基於Web的、分散式的、桌面的和移動的套用設計可視化分析工具和平台。他曾為位於時代廣場的NASDAQ MarketSite實時廣播中心創建可視化產品,目前是DARPA XDATA項目的帶頭人,開發一些新的工具和技術來幫助理解大數據。
圖書目錄
前言
作者簡介
第I部分 概述
第1章 為什麼使用圖 2
1.1 商業中的可視化 3
1.2 商業中的圖 4
1.2.1 找出反常現象 5
1.2.2 管理網路和供應鏈 7
1.2.3 辨別風險模式 9
1.2.4 最佳化資產組合 11
1.2.5 繪製社會等級分層圖 13
1.2.6 發現社區 15
1.3 圖的現狀 16
1.4 小結 17
第2章 圖的類型及其適用的問題 18
2.1 關係 18
2.2 分層 21
2.3 社區 23
2.4 流 27
2.5 空間網路 30
2.6 小結 32
第Ⅱ部分 過程和工具
第3章 數據:收集、清洗和連線 35
3.1 了解目標 35
3.2 收集:識別數據 35
3.2.1 潛在的圖數據源 36
3.2.2 潛在的分層數據源 41
3.2.3 獲取數據 43
3.3 清洗:準備數據 44
3.4 連線:組織圖數據 45
3.4.1 計算圖 46
3.4.2 圖數據的檔案格式 48
3.5 集中回顧 54
3.6 小結 54
第4章 統計數據和布局 55
4.1 基本的圖統計數據 55
4.1.1 大小(節點數和邊數) 55
4.1.2 密度 56
4.1.3 成分數 56
4.1.4 度和路徑 56
4.1.5 中心度 58
4.1.6 病毒式行銷示例 59
4.2 布局 60
4.2.1 節點–連線布局 60
4.2.2 其他布局 61
4.2.3 力導向布局 62
4.2.4 僅節點布局 66
4.2.5 時間布局 67
4.2.6 自頂向下和其他正交分層 68
4.2.7 輻射狀分層 71
4.2.8 地理布局和地圖 72
4.2.9 弦圖 74
4.2.10 鄰接矩陣 74
4.2.11 樹圖 76
4.2.12 分層餅圖 76
4.2.13 平行坐標 77
4.3 集中回顧 79
4.4 小結 79
第5章 視覺特性 80
5.1 基本視覺特性 81
5.2 關鍵的節點特性 82
5.2.1 節點大小 82
5.2.2 節點顏色 84
5.2.3 標籤 87
5.3 關鍵的邊特性 91
5.3.1 邊的權重 91
5.3.2 邊的顏色 91
5.3.3 邊的類型 92
5.4 組合基本特性 93
5.5 捆綁、形狀、圖片及更多 94
5.5.1 捆綁邊 94
5.5.2 形狀 95
5.5.3 節點圖片 95
5.5.4 節點框線 96
5.5.5 更多特性 97
5.5.6 干擾與分隔 97
5.6 集中回顧 101
5.7 小結 101
第6章 探索和解釋 102
6.1 探索、解釋和導出 102
6.2 必要的探索性互動 104
6.2.1 縮放和搖動(以及比例縮放和旋轉) 105
6.2.2 識別 106
6.2.3 過濾器 107
6.2.4 隔離和重做布局 109
6.3 更多互動式探索 110
6.3.1 識別鄰近節點 111
6.3.2 路徑 111
6.3.3 刪除 112
6.3.4 分組 112
6.3.5 疊代分析 114
6.4 解釋 114
6.4.1 數據故事的順序 115
6.4.2 圖例 116
6.4.3 注釋 116
6.4.4 導出數據子集、圖和圖片 118
6.5 集中回顧 119
6.6 小結 120
第7章 滑鼠點擊類圖工具 121
7.1 Excel 121
7.1.1 匯總連線 122
7.1.2 提取節點 122
7.1.3 Excel中的鄰接矩陣可視化 123
7.2 NodeXL 125
7.2.1 NodeXL基礎 125
7.2.2 社交網路功能 127
7.3 Gephi 129
7.3.1 Gephi基礎 129
7.3.2 注意事項 131
7.4 Cytoscape 133
7.4.1 Cytoscape基礎 133
7.4.2 將數據導入Cytoscape 134
7.4.3 視覺特性 135
7.4.4 Apps選單 139
7.5 yEd 139
7.6 小結 141
第8章 輕量級編程 143
8.1 Python 143
8.1.1 上手 143
8.1.2 清洗數據 144
8.1.3 從連線數據集中提取節點集合 145
8.1.4 將電子郵件數據轉換為圖 149
8.1.5 圖資料庫 154
8.2 JavaScript與圖的可視化 155
8.2.1 D3基礎 155
8.2.2 D3和圖 160
8.2.3 D3彈簧圖 169
8.3 小結 174
第Ⅲ部分 圖的可視化分析
第9章 關係 176
9.1 連線和關係 176
9.1.1 詐欺索賠中的相似性 177
9.1.2 網路安全 179
9.2 電子郵件關係 181
空間分隔 181
9.3 演員與電影 184
9.4 將連線轉換為節點 186
9.5 小結 188
第10章 分層 189
10.1 組織結構圖 189
10.2 樹與圖 191
10.3 繪製分層 193
10.4 決策樹 198
10.5 網站樹及有效性 200
10.6 小結 203
第11章 社區 204
11.1 社區的定義特徵 205
11.2 圖聚類 205
11.2.1 社交網路案例分析 206
11.2.2 使用NodeXL和Gephi分析社交媒體 206
11.2.3 可聚類的布局 208
11.2.4 使用顏色描述簇的特徵 210
11.2.5 社區發現 211
11.2.6 使用顏色來區分簇 212
11.2.7 社區話題分析 214
11.2.8 社區情感 216
11.3 團伙和其他組 219
11.3.1 社交媒體中的團伙 220
11.3.2 使用凸包的社區組 220
11.4 小結 223
第12章 流 224
12.1 桑基圖 225
12.2 構造一個桑基圖 229
12.2.1 創建頁面結構 229
12.2.2 處理和建模數據 230
12.2.3 可視化數據 231
12.2.4 高亮顯示通過節點的流 233
12.3 使用流的社區布局 235
12.4 弦圖 237
12.5 構造一個弦圖 238
12.5.1 準備數據 238
12.5.2 創建頁面結構 239
12.5.3 處理和建模數據 240
12.5.4 可視化數據 243
12.5.5 根據需要顯示互動細節 247
12.6 行為因子樹 248
12.7 小結 249
第13章 空間網路 250
13.1 示意圖布局 250
13.2 小世界分組 255
13.3 連線玫瑰匯總 255
13.4 路線模式 263
13.4.1 可視化路線段 264
13.4.2 軌跡聚合 267
13.5 小結 268
第IV部分 高級技術
第14章 大數據 270
14.1 圖資料庫 271
14.1.1 產品行銷示例 271
14.1.2 創建和填充一個圖資料庫 273
14.2 圖查詢語言 275
14.2.1 使用Gremlin進行圖查詢 276
14.2.2 使用圖查詢來提取鄰域 278
14.3 分析鄰域 281
14.4 繪製網路活動 287
14.5 社區可視化 289
14.6 小結 290
第15章 動態圖 291
15.1 圖的變化 291
15.1.1 有機動畫 292
15.1.2 完整時間跨度布局 293
15.1.3 重影 295
15.1.4 淡出 296
15.1.5 社區演化 297
15.2 交易圖 298
15.2.1 聚類交易分析 299
15.2.2 空間交易分析 304
15.3 小結 305
第16章 設計 307
16.1 節點 307
16.1.1 節點的形狀 308
16.1.2 節點大小 313
16.1.3 節點標籤 314
16.2 連線 314
16.3 顏色 318
16.4 小結 320
圖論術語表 322