原始資料

原始資料

原始資料(firsthand data,original data),指的是在所有地質調查工作中獲得的第一手材料(第一性資料)。原始資料是進行各項綜合整理、分析研究的基礎。原始資料是進行各項綜合整理、分析研究的基礎。如區域地質調查中的原始資料包括:地質觀察路線、實測剖面、礦點檢查、物化探工作等的原始記錄和圖件;各類岩石、礦物、古生物標本和各種樣品採樣、鑑定記錄;金屬量測量(包括水系沉積物測量)、重砂分析薄片等的分析鑑定成果;還有各種數據、登記卡片、登記簿、數據處理程式及記錄等。上述資料的齊全、詳細和可靠程度,將直接影響地質圖件的質量和地質礦產的研究程度。

基本介紹

  • 中文名:原始資料
  • 外文名:firsthand data,original data
  • 取得途徑地質調查工作中
  • 收集目的:為了當前調研主題
  • 學科:統計學
資料對比,收集方法,利用原始資料計算百分位數的方法,問題的提出,計算百分位數、中位數的通用公式,

資料對比

原始資料與二手資料的區別:
比較項
原始資料
二手資料
收集目的
為了當前調研主題
為了其他調研主題
收集程式
複雜
簡單
收集時間
收集成本

收集方法

首先,要明確資料的收集範圍,如地域範圍、時間範圍,編專業志還要限以專業範圍。地域範圍是根據行政區域所確定的範圍,但應注意收集有關部門經濟、文化輻射與被輻射等超越地域範圍的資料。時間範圍是每部志書凡例所規定的上下限。專業範圍,凡專業所涉及的內容均在範圍之內,應注意打破部門界限,不要收集專業以外的非專業資料。
其次,要了解資料的來源,資料來源極其廣泛,根據資料的不同存在形式,一般分為文字資料、實物資料、口傳資料、音像資料、圖片資料。其中文字資料是編修地方志主要的資料來源,涉及面廣,主要包括檔案、報刊、史志、譜牒、私人著述、工商實業資料等方面。實物資料,指那些具有歷史價值的實物,如文化遺址、古墓葬、文物、金石、地圖、藝術品、建築物等,都是考察和研究地方經濟文化發展的重要資料。我國歷史上編史修志,都很注重實物資料。口傳資料,包括口碑資料和口頭回憶資料。如民間流傳的故事、典故、民歌、民諺、民謠、方言、曲藝和歷史見聞、回憶等。
根據不同的資料來源,可以採取不同的收集方法。
1、文字資料收集方法。文字資料需要藉助各種目錄索引,有的放矢地收集。一是圖書目錄,二是報刊目錄,三是檔案目錄,四是傳記資料索引。
2、實物資料收集方法。對本地區的山川、景物、道路、古蹟、文物等要進行實地考察,用現代科學方法加以觀測記錄,可以採用文字描述、測繪、拓印、攝影、錄像等手段。
3、口傳資料收集方法。口傳一般通過採訪獲得,採訪形式可多種多樣,如登門拜訪,開座談會、發函徵詢等。民歌、方言、曲藝等必須做錄音。
4、音像資料收集方法。一是收集音像資料原件,二是通過複製的辦法取得所需要的資料。
5、圖片資料收集方法。除了收集原件外,應廣泛收集影印件,如圖片集、地方志、年鑑、期刊及其他圖書中的有關部門圖片資料。
著手收集資料之前,應編制收集資料提綱。提綱是根據志書篇目編制的,逐一注出資料的詳細來源。
此外,還需要合理地安排好工作步驟,提高工作效率。
工作步驟通常有如下七先七後:
(1)先普查後細查。先根據所收集資料的存在形式和來源,做好普查工作,編出一個資料目錄,然後再依照目錄作深入細緻的查閱、收集。
(2)先內後外。先查閱本單位、本系統收藏的檔案資料,後去外單位、外系統、檔案館、圖書館查閱,避免盲目地去外單位收集本單位已有資料的情況發生。先本地區,後外地區。本地區確實查無的資料,再去外地查閱。
(3)先口碑後文獻。應緩收文獻資料,迅速搶救活資料。
(4)先文字後實物。文字記載不全,或有疑問,再進行實地考察。
(5)先古後今,由遠及近。當代歷史資料極其豐富,知情者多,可以放後收集。
(6)先易後難。對於個別收集難度較大的資料,可以放後一步進行,先收集那些省時省力、易查易找的資料,然後再集中力量解決難度較大的資料收集問題。
(7)先直接後間接。不論文獻資料,還是口碑資料,都要先收集原始的第一手的,沒有經過加工的資料。在確實查無直接資料的情況下,再行收集間接資料
當然,在條件允許的情況下,有些步驟可以同時並舉,或交叉進行。有時為了弄清一個問題,往往需要反覆查訪,因此要堅持實事求是的原則,不要先入為主,執一而是。

利用原始資料計算百分位數的方法

問題的提出

百分位數是統計資料描述的重要指標。特別是中位數,不僅具有很好的穩定性,且適用範圍廣泛,可用於偏態資料,分布不明的資料和分布兩端無確定值的資料。頻數表中計算中位數和百分位數的方法在醫學統計學的有關專著和教科書中均有詳細介紹,但對於原始數據,卻都僅給出了計算中位數(M)的公式:
M=X(n+1)/2, n為奇數
M=(Xn/2+X(n/2+1))/2,n為偶數 (1)
式中n為一組觀察值的總個數,((n+1)/2),(n/2)及(n/2+1)為有序數列中觀察值的位次,X(n+1)/2,Xn/2及X(n/2+1)為相應位次上的觀察值。
(1)式只適用於中位數的計算,而用原始資料計算百分位數的方法,尚未見到有關的報導。這給教學工作和實際套用帶來了諸多不便。本文通過研究,給出了用原始數據計算百分位數的通用公式。

計算百分位數、中位數的通用公式

用原始資料計算百分位數Xp時,關鍵是找出相應的百分位數在最小值(有序數列中的第1個值)和最大值(有序數列中的第n個值)之間的位次,並要求該位次的左邊占第一個數到第n個數間距(n-1)的p部分,右邊占整個間距的1-p部分。因此,若以d表示百分位數Xp所在位次,則有
d=1+(n-1)p
Xp=X([d])+(X[d+1]-X([d]))(d-[d]) (2)
公式(2)中[d])表示取d的整數部分,X([d])、X[d+1]分別表示位次為[d],[d+1]上的觀察值。套用公式(2)可對原始資料求百分位數和中位數,因此,公式(2)可代替公式(1)。

相關詞條

熱門詞條

聯絡我們