描述統計學

描述統計學

描述統計學(descriptive statistics)是研究如何取得反映客觀現象的數據(data tabulation),並通過圖表形式對所蒐集的數據進行加工處理和顯示(data visualisation),進而通過綜合概括與分析(statistical summaries)得出反映客觀現象的規律性數量特徵的一門學科。

基本介紹

  • 中文名:描述統計學
  • 外文名:descriptive statistics
  • 解釋:反映客觀現象的數據
  • 原理:加工處理和顯示
  • 方法:數據分布特徵的概括與分析方法等
  • 分類:數學 統計學
簡介,分析,數值方法,對比,

簡介

描述統計學(descriptive statistics)是研究如何取得反映客觀現象的數據(data tabulation),並通過圖表形式對所蒐集的數據進行加工處理和顯示(data visualisation),進而通過綜合概括與分析(statistical summaries)得出反映客觀現象的規律性數量特徵的一門學科。描述統計學內容包括統計數據的收集方法、數據的加工處理方法、數據的顯示方法、數據分布特徵的概括與分析方法等。

分析

描述統計是來描繪(describe)或總結(summarize)的觀察量的基本情況的統計總稱。描述統計學研究如何取得反映客觀現象的數據,並通過圖表形式對所收集的數據進行加工處理和顯示,進而通過綜合概括與分析得出反映客觀現象的規律性數量特徵。
透過對於數據資料的進行圖像化處理,將資料摘要變為圖表,以直觀了解整體資料分布的情況。通常會使用的工具是頻數分布表(frequency distribution table)與圖示法,如多邊圖(polygon)、直方圖(histogram,barchart)、圓形圖(piechart)、散點圖(scatterplot)等。
透過分析數據資料,以了解各變數內的觀察值集中與分散的情況。運用的工具有:集中量數(measure of central location),如平均數(Mean)、中位數(Median,Md)、眾數(Mode,Mo)、幾何平均數(Geometric mean,GM)、調和平均數(Harmonic mean,HM)。與變異量數(measure of variation),如全距(range)、平均差(average deviation,AD)、標準差(standard deviation,SD)、相對差、四分差(quartile deviation)。
推論統計中,測量樣本的集中量數與變異量數都是變數(parameter)的不偏估計值,但是以平均數變異數、標準差的有效性最高。
數據的次數分配情況,往往會呈現常態分配。為了表示測量數據與常態分配偏離的情況,會使用偏態(skewness)、峰度(kurtosis)這兩種統計數據
為了解個別觀察值在整體中所占的位置,會需要將觀察值轉換為相對量數,如百分等級(percentage rank,PR),或標準分數(Z-score,T-score)。

數值方法

數值方法主要涉及利用數據來描述統計數據的位置、離散程度、形態和相關程度。
當數據中有異常值時,使用中位數作為中心位置的度量比平均數更合適。有時,在有異常值的情況下,我們使用另外一種度量方法——調整平均數(trimmed mean)。 刪除數據中最大的和最小的一些數據,然後對剩下的數據求平均值,得到的就是調整平均數。

對比

描述統計學和推斷統計學的劃分,一方面反映了統計方法發展的前後兩個階段,同時也反映了套用統計方法探索客觀事物數量規律性的不同過程。
統計研究過程的起點是統計數據,終點是探索出客觀現象內在的數量規律性。在這一過程中,如果蒐集到的是總體數據(如普查數據),則經過描述統計之後就可以達到認識總體數量規律性的目的了;如果所獲得的只是研究總體的一部分數據(樣本數據),要找到總體的數量規律性,則必須套用機率論的理論並根據樣本信息對總體進行科學的推斷。
顯然,描述統計和推斷統計是統計方法的兩個組成部分。描述統計是整個統計學的基礎,推斷統計則是現代統計學的主要內容。由於在對現實問題的研究中,所獲得的數據主要是樣本數據,因此,推斷統計在現代統計學中的地位和作用越來越重要,已成為統計學的核心內容。當然,這並不等於說描述統計不重要,如果沒有描述統計收集可靠的統計數據並提供有效的樣本信息,即使再科學的統計推斷方法也難以得出切合實際的結論。從描述統計學發展到推斷統計學,既反映了統計學發展的巨大成就,也是統計學發展成熟的重要標誌。

相關詞條

熱門詞條

聯絡我們