生物統計

發展簡況

1866年，揭示了遺傳的基本規律，這是最早運用數理統計於生物實驗的一個成功的範例（見）。1889年，在《自然的遺傳》一書中，通過對人體身高的研究指出,子代的身高不僅與親代的身高相關,而且有向平均值“回歸”的趨勢，由此提出了“回歸”和“相關”的概念和算法，從而奠定了生物統計的基礎。高爾頓的學生K.皮爾遜進一步把統計學套用於生物研究，提出了實際測定數與理論預期數之間的偏離度指數即卡方差()的概念和算法，這在屬性的統計分析上起了重要作用。1899年，他創辦了《生物統計》雜誌，還建立了一所數理統計學校。他的學生W.S.戈塞特對樣本標準差作了許多研究,並於1908年以“Student”的筆名將t-檢驗法發表於《生物統計》雜誌上。此後，t-檢驗法就成了生物統計學中的基本工具之一。英國數學家指出，只注意事後的數據分析是不夠的，事先必須作好實驗設計。他使實驗設計成了生物統計的一個分支。他的學生G.W.斯奈迪格把變異來源不同的均方比值稱為F值,並指出當值大於理論上 5%機率水準的值時，該項變異來源的必然性效應就從偶然性變數中分析出來了，這就是“方差分析法”。上述這些方法對於農業科學、生物學特別是的研究，起了重大的推動作用，20世紀20年代以來，各種數理統計方法陸續創立，它們在實驗室、田間、飼養和臨床實驗中得到廣泛套用並日益擴大到整個工業界。70年代，隨著計算機的普及，使本來由於計算量過大而不得不放棄的統計方法又獲得了新的生命力，套用更為廣泛，並在現代科技中占有十分重要的地位。

參數

一個觀測對象(如一個7歲男孩)的某些性狀（如身高等）的量度結果，稱為一個個體。來源相同的各個個體(如各個 7歲男孩的身高值)之間的差異稱為個體變異。總體是通過統計所欲了解的對象，其中的個體可以是有限的也可以是無限的。觀測數據可以是計數的（離散的）（如單位面積中的昆蟲數），也可以是計量的（如身高、體重、血壓、肺活量等）。總體最基本的參數有兩類：表示水平的稱為位置參數或型值，如平均數、中位數、率等；反映個體差異大小的稱為分散度參數，如標準差、極差等。總體參數是一個客觀存在但通常卻又是未知的常數。只能用樣本去估計它。這樣做自然會有誤差。樣本平均數,即

[1432-01]其中表示第個個體的觀測值；為樣本中的個體數，稱為樣本大小；∑為求和號,∑表示的合計凡是從樣本計算出來的數值都稱為統計量，它是對相應的總體值的一種估計例如是總體均數的一種估計。若總體均數正好等於，則稱為的無偏估計，意謂用估計雖有誤差但平均來說是無偏的。此時又稱為的期望，記作[1432-02]。

抽樣

為了估計總體的參數（如均數、率、標準差等）而從其中抽出一部分個體組成供分析的樣本稱為抽樣。抽樣方法應能防止主、客觀因素造成偏性（即系統誤差），保證樣本對總體的代表性。簡單隨機抽樣是以抽籤或相當於抽籤的方式從總體中抽取個體組成樣本。其要點是：總體中每個個體被抽中的機會必須均等。系統抽樣是將總體劃分為時間或空間順序相等的個部分，再機械地取每一部分的第個個體組成樣本，是一次隨機抽定的。例如，欲抽查十分之一學生的成績,可從0到9這10個整數中隨機地抽定一個數，假設為3，則凡學生證號最後一個數是 3者均為被抽中的對象。分層抽樣是事先將總體分為不同的層次（如地區、年齡、性別等），再分別從各層次中按適當比例抽樣。用此法可以從層間差異較大的總體中獲取代表性較好的樣本。整群抽樣是以群體為單位進行抽樣，凡抽中的單位就全面調查。此法便於實施，但抽樣誤差較大，一般不可沿用基於簡單隨機抽樣的普通公式計算抽樣誤差。此外，還可以分階段地、混合地使用上述方法。如兩階段抽樣、多階段抽樣、分層整群抽樣、多階段等機率抽樣等。

生物統計

基本介紹

發展簡況

參數

抽樣

非參數統計

生存分析

多元分析

統計工具

套用

相關詞條

熱門詞條