新型資料庫

產生背景

傳統資料庫技術的產生不是為了分析海量數據，而是為了數據記錄、事務處理（OLTP）。當數據量不斷膨脹之後，用戶就會產生越來越多的分析需求，而傳統資料庫在分析處理時，整體性能會大大降低。造成此問題的原因如下：

傳統行存儲導致大量無效 I/O

傳統索引不適於海量數據

傳統行存資料庫索引需要手工設定，對套用不完全透明，隨場景和需求的變化需要不斷調整，人工維護成本很高。並且傳統索引占用存儲空間很大，甚至高於數據本身，造成查詢效率的下降。

數據裝載速度慢

因為索引需要重新創建，載入性能會變的很糟糕。分析型架構系統要解決這些個問題，必須最大限度地減少磁碟 I/O ，提升查詢效率，減小人工維護成本。南大通用分析型資料庫GBase8a （以下簡稱GBase 8a）通過列存儲模式、數據壓縮、智慧型化的索引、並行處理、並發控制、高效的查詢最佳化器等技術，使得上述問題得到有效解決。以下各節將描述 GBase 8a 的創新架構如何實現這些目標。

隨著雲計算和大數據時代的到來，行業數據和移動網際網路套用對數據交易處理的實時性和規模提出更高的要求。例如，淘寶每天千萬量級交易筆數，50GB匯總結果，7億條日誌記錄，1.5PB原始數據記錄;FaceBook每天處理27億次Like按鈕點擊,上傳3億張圖片，由人工或系統自動執行的請求達到7萬次，吸收逾500TB新數據。傳統資料庫面臨前所未有的挑戰：首先，數據處理需求與傳統資料庫平台硬體擴展的差距不斷擴大，傳統的資料庫性能和TB級數據處理規模已不能滿足海量數據的實時交易查詢需求。其次，通過不斷堆疊高性能盤陣獲取性能提升的傳統擴展方式，使得底層硬體和資料庫軟體採購成本不斷攀升。在性能和成本的雙重壓力之下，資料庫需要尋找突破之路。淘寶、Facebook、Google、騰訊、百度等網際網路企業紛紛展開探索，面向不同套用的各種新型資料庫應運而生。

設計思想

三個“1/10”

把執行同樣一條查詢語句所需要磁碟的 I/O 降低到傳統行存儲資料庫的1/10 以下；

在啟動壓縮的情況下，同樣的裸數據載入到資料庫後占有的磁碟空間是傳統行存儲資料庫的 1/10 以下；

人工管理費用（安裝、調試、最佳化、維護、擴展等）是傳統行存儲資料庫的1/10 以下。

兩個“10 倍以上”

在海量數據分析型套用中，平均綜合查詢性能（複雜查詢、即席查詢、模糊查詢、分頁查詢、TOP-N 查詢等）是傳統行存儲資料庫的 10 倍以上；

壓縮比 10 倍以上。

技術創新

新型資料庫採用分散式並行計算架構，部署於X86通用伺服器，滿足大數據實時交易需求，成本低、擴展性高，突破了傳統資料庫性能瓶頸。

新型資料庫

產生背景

設計思想

技術創新

資料庫簡介

技術特性

關鍵指標

產品優勢

相關詞條

熱門詞條