大型數據系統

大型數據系統是一個需較大的記憶體來支持的資料庫管理系統核心。對設備和技術要求較高。國際國內的大型數據系統有ORACLE、SYBASE、INFORMIX和INGRES。這些產品都支持多平台,如UNIX、VMS、 WINDOWS,但支持的程度不一樣。在下面的分析中會比較他們的平台支持能力。IBM 的DB2也是成熟的關係型資料庫。但是,DB2是內嵌於IBM的 AS/400系列機中,只支持OS/400作業系統。

基本介紹

  • 中文名:大型數據系統
  • 外文名:Large data system
  • 縮寫:LDS
  • 涉及學科:計算機等
  • 套用:軍事、經濟、文化 等
  • 包含:MySQL、Oracle等
大型數據系統,Oracle,MySQL,Microsoft SQL Server,Sybase,IBM DB2,xBase,ACCESS,INGRES智慧型關係性資料庫管理系統,大型資料庫系統中的並行處理技術,大型資料庫系統套用,

大型數據系統

商品化的資料庫管理系統以關係型資料庫為主導產品,技術比較成熟。面向對象的資料庫管理系統雖然技術先進,資料庫易於開發、維護,但尚未有成熟的產 品。國際國內的主導關係型資料庫管理系統有ORACLE、SYBASE、INFORMIX和INGRES。這些產品都支持多平台,如UNIX、VMS、 WINDOWS,但支持的程度不一樣。在下面的分析中會比較他們的平台支持能力。IBM 的DB2也是成熟的關係型資料庫。但是,DB2是內嵌於IBM的 AS/400系列機中,只支持OS/400作業系統。

Oracle

Oracle是以高級SQL為基礎的大型關係資料庫,通俗地講,它是用方便邏輯管理的語言操縱大量有規律數據的集合,是目前最流行的客戶/伺服器(Client/Server)體系結構的資料庫之一。
Oracle具有如下特點:
①Oracle 7.X以來引入了共享SQL和多線索伺服器體系結構。這減少了Oracle的資源占用,並增強了Oracle的能力,使之在低檔軟硬體平台上用較少的資源就可以支持更多的用戶,而在高檔平台上可以支持成百上千個用戶。
②提供了基於角色(Role)分工的安全保密管理。在資料庫管理功能、完整性檢查、安全性、一致性方面都有良好的表現。
③支持大量多媒體數據,如二進制圖形、聲音、動畫以及多維數據結構等。
④提供了與第3代高級語言的接口軟體PRO+系列,能在c,c++等宿主語言中嵌人SQL語句及過程化(PL/SQL)語句,對資料庫中的數據進行操作。加上它有許多優秀的前台開發工具如PowerBuild,SQL"FORMS,Visual Basic等,可以快速開發生成基於客戶端PC平台的應用程式,並具有良好的移植性。
⑤提供了新的分散式資料庫能力。可通過網路較方便地讀寫遠程資料庫里的數據,並有對稱複製的技術。

MySQL

MySQL是一個精巧的SQL資料庫管理系統,雖然它不是開放原始碼的產品,但在某些情況下可以自由使用。由於它的強大功能、靈活性、豐富的套用編程接口(API)以及精巧的系統結構,所以它受到了廣大自由軟體愛好者甚至是商業軟體用戶的青睞,特別是與Apache和PHP/PERL結合,為建立基於資料庫的動態網站提供了強大動力。
MySQL是一個真正的多用戶、多進程SQL資料庫伺服器。SQL是世界上最流行的和標準化的資料庫語言。MySQLd是一個客戶機/伺服器結構的實現,它由一個伺服器守護程式MySQLd和很多不同的客戶程式和庫組成。
自1996年以來,它的環境已經超過40個資料庫,包含10 000個表,其中500多個表超過700萬行,這大約有100 GB的關鍵套用數據。MySQL建立的基礎是業已用在高要求的生產環境多年的一套實用例程。儘管MySQL仍在開發中,但它已經提供一個豐富和極其有用的功能集。

Microsoft SQL Server

SQL Server是一個關係資料庫管理系統,它最初是由MicrosoN、Sybase和Ashton—Tate 3家公司共同開發的,於1998年推出了第一個0S/2版本。在Windows NT推出後,Microsog與Sybase在SQL Server的開發上就分道揚鑣了。Microsoft將SQL Server移植到Windows NT系統上,專注於開發、推廣SQL Server的Windows NT版本;Sybase則較專注於SQL Server在UNIX作業系統上的套用。
使用Microsoft SQL Server 2000的最新增強功能可以開發資料庫解決方案。建立在SQLServer 7.0可擴展基礎上的SQL Server 2000代表著下一代Microsoft.NET Enterprise Servers(企業伺服器)資料庫的發展趨勢。SQL Server 2000是為創建可伸縮電子商務、線上商務和數據倉儲解決方案而設計的真正意義上的關係型資料庫管理與分析系統。
Microsoft針對包括集成數據挖掘、OLAP服務、安全性服務及通過Internet對多維數據集進行訪問和連結等在內的分析服務提供了新的數據倉儲功能。
電子商務解決方案對資料庫應用程式提出了更高要求。除了提供電子商務所需的可伸縮性與可擴展性之外,SQL Server 2000還提供了豐富的資料庫編程能力——基於Web標準——以確保系統的協同工作和靈活性。與此相關,SQL Server 2000還將豐富的擴展標記語言(XML)、Wodd Wide Web Consortium(全球資訊網社團,W3C)標準支持、利用Transact SQL(TSQL)實現的XML數據操作能力、靈活而強大的Web分析功能以及使用HyperText TransferProtocol(HTTP,超文本傳輸協定)進行的安全web數據訪問等新特性包含在內。
SQL Server已成為頗客群多客戶關係管理(CRM)應用程式、商務智慧型(BI)應用程式、企業資源計畫(ERP)應用程式及其他線上商務應用程式廠商和客戶所青睞的數據產品,而這些主要應歸功於該產品在對稱多處理(SMP)硬體方面所具有的可伸縮性和較低的資料庫維護需求。通過使用SQL Server 2000 Server,將獲得增強的可靠性、可伸縮性和簡化的管理與最佳化功能,而這些則恰恰是成功快速部署線上商務應用程式所必須的。SQL Server 2000不僅支持集中化資料庫管理功能,而且還最大程度地實現了管理與最佳化工作的自動化,從而減輕了有關管理人員的負擔。

Sybase

Sybase公司是1954年成立的,屬於後起之秀。它推出了支持企業範圍的“客戶/伺服器體系結構”的資料庫。Sybase把“客戶/伺服器資料庫體系結構”作為開發產品的重要目標。它吸取了INGRES的研製經驗,以滿足在線上事務處理套用的要求,於1987年推出了SybaseSQL Server,稱為大學版INGRES的第3代產品。
Sybase是一個面向在線上事務處理,具有高性能,高可靠性的功能強大的關係型資料庫管理系統。Sybase資料庫的多庫、多設備、多用戶、多線索等特點極大地豐富和增強了資料庫功能。因為Sybase資料庫系統是一個複雜的、多功能的系統,所以對Sybase資料庫系統的管理就變得十分重要,管理的好壞與資料庫系統的性能息息相關。
Sybase System 11.5是其最新產品,支持企業內部各種資料庫套用需求,如數據倉庫、在線上事務處理、決策支持系統和小平台套用等。
Sybase System 11.5的伺服器端和新產品是Adaptive Server。它集成了原有的伺服器系列,如SQL Server,SQL Anywhere,Sybase IQ,Sybase MPP等。它具有處理多種數據源的能力,包括遺留的非關係數據和分布的事務;提供了最佳化的數據存儲與訪問方法;提供了單一的編程模型。
SYBASE的開發工具有:
DATA WORKBENCH
* VISUAL QUERY LANGUANGE(圖形查詢語言)
* REPORT WORKBENCH(報表系統)
* INTERACTIVE SQL(互動式SQL環境)
* DATA ENTRY(快速錄入數據)
APT WORKBENCH EMBEDED SQL SQR WORKBENCH(開放式報表系統)
* EASY SQR(基於選單的報表生成器)
* SQR 4GL(第四代語言報表生成器)
* SQR DEBUG(調試工具)
* SQL—EXECUTE(動態表格配置)
GAIN MOMENTUM(面向對象的多媒體開發平台,可以 編輯動畫、聲音、點陣圖)
SYBASE的不足:
*多伺服器系統不支持分布透明
*REPLICATION SERVER數據方面的性能較差,並不能 與作業系統集成
*對中文的支持較差
*多用於銀行系統等
*尚無在此資料庫基礎上的企業管理信息系統

IBM DB2

DB2是IBM公司的產品,起源於System R和System R+。它支持從PC到UNIX、從中小型機到大型機、從IBM到非IBM(HP及SUN UNIX系統等)各種操作平台。它既可以在主機上以主/從方式獨立運行,也可以在客戶/伺服器環境中運行。其中服務平台可以是OS/400,AIX,OS/2,HP.UNIX,SUN-Solaris等作業系統,客戶機平台可以是OS/2或Windows,DOS,AIX,HP-UX,SUN Solaris等作業系統。
IBM DB2資料庫環境以用於大型公司、政府、電信和郵電行業等需要海量數據處理的場所而聞名。
DB2資料庫核心又稱作DB2公共伺服器,採用多進程多線索體系結構,可以運行於多種作業系統之上,並分別根據相應平台環境做了調整和最佳化,以便能夠達到較好的性能。

xBase

xBase是dBase,FoxBase、FoxPro的統稱,用xBase建立的系統通常包含很多不同類型的檔案,每一個表、程式、報表、查詢、索引、選單等內容都是以檔案的方式存放在磁碟上,可以通過項目檔案對其他類型的檔案進行組織與管理;在xBase中,表、記錄等數據操縱或界面的設計採用的是xBase。命令進行編程,高版本的FoxPro中引人了部分SQL語句主要用來完成數據的查詢:xBase。中採用面向過程的程式設計方法,即使是一個用戶輸人界面的設計也濡要較長的一段xBase程式。

ACCESS

ACCESS對資料庫的組織同大型後台資料庫系統的資料庫組織非常相似,不同數據或程式元未稱為對象,所有的對象都存儲在一個物理檔案中,而這個物理檔案被稱為資料庫。

INGRES智慧型關係性資料庫管理系統

INGRES資料庫系統的多項技術直接採用了伯克利大學最新研究成果。技術上一直處於領先水平。
INGRES資料庫不僅能管理數據,而且還能管理知識和對象(對象是指數據與操作的結合體,計算機把他們作為整體處理)。INGRES產品分為三類:第一類為資料庫基本系統,包括了數據管理、知識管理、和對象管理。第二類為開發工具。第三類為開放互聯產品。
INGRES的基本資料庫管理系統中的數據管理支持下面特點:
*開放的客戶機/伺服器體系結構,允許用戶建立多個多線索伺服器。
*編譯的資料庫過程。資料庫過程用INGRES第四代語言編 寫。由伺服器編譯管理,用來實現預定義的事務處理,減小CPU負載,減小網路開銷。
*智慧型最佳化功能。根據查詢語言的要求自動地在網路環境中調 整查詢順序,尋找最佳路徑。*數據的線上備份。無需中斷系統的正常運行,備份保持一致性的資料庫備份。
*I/O減量處理。提供快速提交、成組提交、多塊讀出與寫入的技術。減少I/O量。
*多檔案存儲數據。一個表用一個檔案存儲,便於在異常情況下對資料庫存進行恢復。
*採用兩階段提交協定,保證了網路分布事務的一致性。
*具有資料庫規則系統。自動激活滿足行為條件的規則,對每個表擁有的獨立規則數不受限制,
*無限制的向前推理和無限遞歸,確保資料庫的一致性。
*具有報警系統,當數據在規定的數據量極限時,自動作出相應的操作。
*資源控制與查詢最佳化相結合,由伺服器控制查詢的資源消耗,確保系統的可預測性能。
*能夠對用戶自己定義的數據類型進行處理、存儲,定義數據的有效區間。
*允許用戶將自己定義的函式嵌入到資料庫管理系統中。

大型資料庫系統中的並行處理技術

下面簡單介紹大型資料庫系統Oracle和Sybase中的並行處理技術。
運行在MPP或SMP群集機系統平台上的Oracle資料庫提供了多種並行處理機制。
一種是單個語句的並行處理。Oracle7.1在Oracle7並行事務處理的基礎上支持單個語句的並行處理。這種並行處理機制被嵌入到資料庫的核心部分,通過單個語句的並行處理提高SQI。語句的執行速度,隨著CPU數目的增加系統的性能將不斷提高。
對查詢語句的並行處理是將SQL查詢語句分解成若干子任務,分配給多個CPU並行處理。這種並行有兩種方式,一種是子任務內並行,一種是子任務間並行。為了緩解I/O瓶頸,在數據交換中採用高速緩衝改善性能。對並行處理中涉及的大量中間數據交換採用流水線方法實現。Oracle7.1對索引操作採用了並行的全表掃描和並行排序,利用操作內及操作間的並行處理技術使索引操作在多個CPU上並行執行,大大加快了索引速度。系統對資料庫恢復也採用了並行處理,由多個CPU並行完成,顯著地減少了恢復時間。
數據載入(SQL.LOADER)過程也是並行執行的。Oracle7.0繼承了Oracle7“直接路徑載入”技術,通過語法分析將數據載入分解為多個CPU並行完成,充分利用了I/O並行技術,使數據均勻分布在多個磁碟上。
在多處理機環境下,Sybase無共享體系結構實現了資料庫的並行處理,包括多伺服器並行和伺服器內的並行。Sybase資料庫系統並行體現在多進程、多執行緒的並行運行,可以處理多個用戶的事務請求。可根據處理器的數目設定資料庫伺服器的進程,每個進程包含多個執行緒以並行處理用戶的訪問要求。Sybase提供了一系列並行控制和管理機制,包括封鎖機制、緩衝機制和日誌機制等。這些機制構成了Sybase資料庫伺服器的核心層,使Sybase增強了跨平台特性。
資料庫並行技術因並行計算技術的發展有著廣闊的前景,在資料庫套用要求不斷向大容量高速度發展的今天,深入研究並行資料庫技術,開發適合併行計算環境的並行資料庫系統必將推動資料庫的進一步發展和套用。

大型資料庫系統套用

目前,人們在日常生活中,經常通過電話、網路訂購圖書、火車票、飛機票,或查詢某些數據信息,所有這些都屬於大型資料庫系統。大型資料庫系統在軍事、經濟、文化、體育和科學等各個領域都發揮著及其重要的作用。
第43屆世界桌球錦標賽(天津)網路系統是一個大型資料庫套用系統,系統通過網路集註冊、競賽組織、記時記分、信息查詢、大螢幕顯示、電視實況轉播、電子文印於一體,實現了各種數據信息的同步協調控制和共享。系統布局如圖1所示,系統的整體數據組織結構如圖2所示。
系統布局系統布局
系統的整體數據組織結構系統的整體數據組織結構
從上述系統分布圖和資料庫組織結構圖中可以看出,大型資料庫系統是複雜的,其複雜性體現在:
  • 人員複雜。大型資料庫系統需要各種各樣的人員,如:計算機技術人員、項目專業人員、管理人員、操作人員等。
  • 環境複雜。大型資料庫系統通常涉及到廣泛的地理範圍,環境複雜多樣。
  • 技術、設備複雜。大型資料庫系統對技術、設備要求高,涉及到的內容廣泛。
  • 大型資料庫系統需要解決的最主要問題是地理範圍問題、實時處理問題和並發控制問題。

相關詞條

熱門詞條

聯絡我們