大數據技術前沿

內容簡介

本選題以科普的方式系統地闡述了大數據前沿技術與研究進展，對技術的來源、結論、對比、用途以及開源軟體進行了深入淺出的描述，並不過多地涉及數學符號及基礎原理。以大數據可視化為切入點，通過自然語言處理、社交網路挖掘、語義網路與知識圖譜三方面非結構化數據處理技術，闡述大數據經典套用，利用基於圖資料庫、記憶體計算、分散式存儲系統的大數據存儲與管理作為大數據平台支撐，進而探討基於眾包技術擴充數據來源與提高數據質量，並圍繞大數據環境下的隱私保護問題，探討了大數據安全技術

目錄信息

第1章　大數據可視化 1

1.1?可視化基礎 2

1.1.1?可視化釋義 2

1.1.2?可視化流程 5

1.1.3?可視化對象 6

1.1.4?可視化方法 10

1.2?大數據可視化介紹 36

1.2.1?大數據可視化特點 37

1.2.2?大尺度數據的可視化 38

1.2.3?快速變化數據的可視化 41

1.2.4?多變數數據的可視化 44

1.2.5?非結構化數據的可視化 50

1.2.6?大數據可視分析 53

1.3?可視化與可視分析研發資源 60

1.3.1?代表性開源與商業軟體 60

1.3.2?開發工具與程式語言 61

1.3.3?可視化信息資源 62

1.3.4?部分可視化科研機構 63

參考文獻 64

第2章　文本大數據處理 67

2.1 文本大數據概述 67

2.2?中文詞法分析 70

2.3?句法分析 73

2.4?語義分析 74

2.5?開源項目與共享工具 75

2.6?文本大數據的部分套用 76

2.6.1?概述 76

2.6.2?基於雙數組Trie樹的面向微博短文本的分詞 77

2.6.3?詞義消歧 80

2.6.4?未登錄詞識別 83

2.6.5?文本分類與文本聚類 84

2.6.6?機器翻譯 86

2.6.7?其他套用 87

參考文獻 89

第3章　社交網路大數據挖掘 91

3.1? 概述 91

3.2?大規模異構網路集成 94

3.2.1?計算模型——COSNET 96

3.2.2?模型求解 98

3.2.3?實驗結果 99

3.3?基於互動的網路機器學習 101

3.3.1?網路數據的主動互動學習 101

3.3.2?算法模型——MaxCo 102

3.3.3?網路流數據的主動互動學習 103

3.3.4?算法模型 104

3.4?基於隨機路徑的高效網路拓撲相似度算法 106

3.4.1?問題定義 107

3.4.2?基於隨機路徑的網路拓撲相似度算法——Panther 107

3.4.3?實驗結果 110

3.4.4?小結 113

3.5?個體行為與網路分布的統一建模框架——M3D 113

大數據技術前沿

基本介紹

內容簡介

目錄信息

前言

相關詞條

熱門詞條