數據記錄

數據記錄

數據記錄是指對應於數據源中一行信息的一組完整的相關信息。例如,客戶郵件列表中的有關某位客戶的所有信息為一條數據記錄。

基本介紹

  • 中文名:數據記錄
  • 外文名:data record
  • 定義:記錄數據源中一條完整的數據
  • 套用:資料庫等
簡介,詳細介紹,數據倉庫,面向主題,集成的,相對穩定的,反映歷史變化,

簡介

數據(data)是對客觀事物的符號表示,是用於表示客觀事物的未經加工的原始素材,如圖形符號、數字、字母等。或者說,數據是通過物理觀察得來的事實和概念,是關於現實世界中的地方、事件、其他對象或概念的描述。數據記錄是指對應於數據源中一行信息的一組完整的相關信息。例如,客戶郵件列表中的有關某位客戶的所有信息為一條數據記錄。

詳細介紹

在計算機科學中,數據是指所有能輸入到計算機並被電腦程式處理的符號的介質的總稱,是用於輸入電子計算機進行處理,具有一定意義的數字字母符號模擬量等的通稱。是組成地理信息系統的最基本要素。種類很多,按性質分為:①定位的,如各種坐標數據;②定性的,如表示事物屬性的數據(居民地河流道路等);③定量的,反映事物數量特徵的數據,如長度面積體積幾何量重量速度物理量;④定時的,反映事物時間特性的數據,如年、月、日、時、分、秒等。按表現形式分為:①數字數據,如各種統計或量測數據;②模擬數據,由連續函式組成,又分為圖形數據(如點、線、面)、符號數據、文字數據和圖像數據等。按記錄方式分為地圖表格影像磁帶紙帶。按數位化方式分為矢量數據格網數據等。在地理信息系統中,數據的選擇、類型、數量、採集方法、詳細程度、可信度等,取決於系統套用目標、功能、結構和數據處理、管理與分析的要求。
數據倉庫一詞尚沒有一個統一的定義,著名的數據倉庫專家w.h.inmon在其著《buildingthedatawarehouse》一書中給予如下描述:數據倉庫(datawarehouse)是一個面向主題的(subjectoriented)、集成的(integrate)、相對穩定的(non-volatile)、反映歷史變化(timevariant)的數據集合,用於支持管理決策。對於數據倉庫的概念我們可以從兩個層次予以理解,首先,數據倉庫用於支持決策,面向分析型數據處理,它不同於企業現有的操作型資料庫;其次,數據倉庫是對多個異構的數據源有效集成,集成後按照主題進行了重組,並包含歷史數據,而且存放在數據倉庫中的數據一般不再修改。

數據倉庫

根據數據倉庫概念的含義,數據倉庫擁有以下四個特點:

面向主題

操作型資料庫的數據組織面向事務處理任務,各個業務系統之間各自分離,而數據倉庫中的數據是按照一定的主題域進行組織。主題是一個抽象的概念,是指用戶使用數據倉庫進行決策時所關心的重點方面,一個主題通常與多個操作型信息系統相關。

集成的

面向事務處理的操作型資料庫通常與某些特定的套用相關,資料庫之間相互獨立,並且往往是異構的。而數據倉庫中的數據是在對原有分散的資料庫數據抽取、清理的基礎上經過系統加工、匯總和整理得到的,必須消除源數據中的不一致性,以保證數據倉庫內的信息是關於整個企業的一致的全局信息。

相對穩定的

操作型資料庫中的數據通常實時更新,數據根據需要及時發生變化。數據倉庫的數據主要供企業決策分析之用,所涉及的數據操作主要是數據查詢,一旦某個數據進入數據倉庫以後,一般情況下將被長期保留,也就是數據倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的載入、刷新。

反映歷史變化

操作型資料庫主要關心當前某一個時間段內的數據,而數據倉庫中的數據通常包含歷史信息,系統記錄了企業從過去某一時點(如開始套用數據倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業的發展歷程和未來趨勢做出定量分析和預測。
企業數據倉庫的建設,是以現有企業業務系統和大量業務數據的積累為基礎。數據倉庫不是靜態的概念,只有把信息及時交給需要這些信息的使用者,供他們做出改善其業務經營的決策,信息才能發揮作用,信息才有意義。而把信息加以整理歸納和重組,並及時提供給相應的管理決策人員,是數據倉庫的根本任務。因此,從產業界的角度看,數據倉庫建設是一個工程,是一個過程。
資料庫是依照某種數據模型組織起來並存放二級存儲器中的數據集合。這種數據集合具有如下特點:儘可能不重複,以最優方式為某個特定組織的多種套用服務,其數據結構獨立於使用它的應用程式,對數據的增、刪、改和檢索由統一軟體進行管理和控制。從發展的歷史看,資料庫是數據管理的高級階段,它是由檔案管理系統發展起來的。
資料庫的基本結構分三個層次,反映了觀察資料庫的三種不同角度。
(1)物理數據層。它是資料庫的最內層,是物理存貯設備上實際存儲的數據的集合。這些數據是原始數據,是用戶加工的對象,由內部模式描述的指令操作處理的位串、字元和字組成。
(2)概念數據層。它是資料庫的中間一層,是資料庫的整體邏輯表示。指出了每個數據的邏輯定義及數據間的邏輯聯繫,是存貯記錄的集合。它所涉及的是資料庫所有對象的邏輯關係,而不是它們的物理情況,是資料庫管理員概念下的資料庫。
(3)邏輯數據層。它是用戶所看到和使用的資料庫,表示了一個或一些特定用戶使用的數據集合,即邏輯記錄的集合。
資料庫不同層次之間的聯繫是通過映射進行轉換的。資料庫具有以下主要特點:
(1)實現數據共享。數據共享包含所有用戶可同時存取資料庫中的數據,也包括用戶可以用各種方式通過接口使用資料庫,並提供數據共享。
(2)減少數據的冗餘度。同檔案系統相比,由於資料庫實現了數據共享,從而避免了用戶各自建立套用檔案。減少了大量重複數據,減少了數據冗餘,維護了數據的一致性。
(3)數據的獨立性。數據的獨立性包括資料庫中資料庫的邏輯結構和應用程式相互獨立,也包括數據物理結構的變化不影響數據的邏輯結構。
(4)數據實現集中控制。檔案管理方式中,數據處於一種分散的狀態,不同的用戶或同一用戶在不同處理中其檔案之間毫無關係。利用資料庫可對數據進行集中控制和管理,並通過數據模型表示各種數據的組織以及數據間的聯繫。
(5)數據一致性和可維護性,以確保數據的安全性和可靠性。主要包括:①安全性控制:以防止數據丟失、錯誤更新和越權使用;②完整性控制:保證數據的正確性、有效性和相容性;③並發控制:使在同一時間周期內,允許對數據實現多路存取,又能防止用戶之間的不正常互動作用;④故障的發現和恢復:由資料庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞。

相關詞條

熱門詞條

聯絡我們