樣本分布

樣本分布

總體是指考察的對象的全體, 個體是總體中的每一個考察的對象, 樣本是總體中所抽取的一部分個體, 而樣本容量則是指樣本中個體的數目。樣本分布是用來估計總體分布的。樣本分布有區別於總體分布,它是從總體中按一定的分組標誌選出來的部分樣本容量。

基本介紹

  • 中文名:樣本分布
  • 外文名:Sample distribution
  • 學科:機率統計學名詞
樣本定義,樣本統計量與樣本分布,樣本分布函式,相關概念,心理學概念,統計學概念,

樣本定義

實際中很多不確定現象都可以用隨機變數描述,而套用中的一個十分重要的問題是找到隨機變數的分布或其數字特徵。 例如:某進出口貿易公司進口了10萬台微型計算器,按產品技術規定,使用壽命小於4000小時即為次品,且次品率大於1% 就不接受這批產品。得知這批產品的次品率的好辦法就是隨機抽樣,然後根據抽樣檢驗得到的次品率來估計整批產品的次品率。也就是從10萬台產品中按隨機原則,抽取一部分(假如100件)產品組成一個樣本,由樣本(100件產品)次品率推斷整批產品的次品率。
這裡,我們把被觀察對象的全體(本例中的10萬台計算器)稱作總體,把從總體中隨機抽取的(被抽中的100台計算器)小群體稱作樣本,而樣本中所包含的個體單位數目稱為樣本容量(100個)。
對於這批計算器,我們關心的是它的使用壽命(低於4000小時的比例有多少)的分布,設X表示“任一台計算器的使用壽命”,它是一個隨機變數,我們把隨機抽中的100件產品看作是100個隨機變數
,每一個計算器的使用壽命都是一個隨機變數,一旦測試完畢,測試的結果就是100個觀測值
,統計抽樣的任務就是根據測試結果
來估計總體X的分布情況。
我們作如下概括:設X是一個隨機變數
是一組相互獨立與X具有相同分布的隨機變數,稱X為總體,
為來自總體的簡單隨機樣本,簡稱樣本,n為樣本容量,稱樣本觀察值為樣本值,由於按隨機原則取樣,在試驗之前,人們無法知道試驗的結果,所以
,是一組隨機變數,而在試驗之後,得到一組
的觀察值
,它們則是一組確定的數值。
研究中實際觀測或調查的一部分個體稱為樣本(sample),研究對象的全部稱為總體。為了使樣本能夠正確反映總體情況,對總體要有明確的規定;總體內所有觀察單位必須是同質的;在抽取樣本的過程中,必須遵守隨機化原則;樣本的觀察單位還要有足夠的數量。又稱“子樣”。按照一定的抽樣規則從總體中取出的一部分個體。樣本中個體的數目稱為“樣本容量”。
如作水質檢驗時從井水或河水中采的水樣,臨床化驗中從病人身上采的血液或其它活體組織標本,是樣本;而整個一口井或一條河的某一段所有的水,某病人全身所有的血液或某個組織器官,則是總體。這類總體是具體存在的,但另有些總體卻是假想的,只是理論上存在的一個範圍。例如試驗某一治療流感新藥的療效,最初接受治療的一批流感患者,不論數量多少,都只是一個樣本。若該藥療效得到肯定,從而加以推廣,那么此後凡在相同條件下接受該藥治療的所有流感患者,都屬於這個總體。可是當初試用時,這個總體還並不存在,是假想的。
總體包含的觀察單位通常是大量的甚至是無限的,在實際工作中,一般不可能或不必要對每個觀察單位逐一進行研究。我們只能從中抽取一部分觀察單位加以實際觀察或調查研究,根據對這一部分觀察單位的觀察研究結果,再去推論和估計總體情況。如上述某新藥治療流感例子,試驗治療的只是少數有限的病人,而結論卻要推廣到全體,得出一個該藥對所有流感患者之療效的規律性的認識。所以說,觀察樣本的目的在於推論總體,這就是樣本與總體的辯證關係。

樣本統計量與樣本分布

總體實際上就是一個隨機變數X,有一定的機率分布和分布的數字特徵。由於總體分布的數字特徵往往也就是機率分布函式中的參數(如常態分配數學期望方差就是密度函式中的參數μ和σ;二項分布的數學期望和方差就是參數np和npq等),所以根據樣本信息估計總體數字特徵就稱為參數估計。在進行參數估計時,我們並不是直接用一個個的具體樣本值來估計、推測總體參數,而是根據樣本值得出的一些特定的量,來估計總體參數的。由樣本得出的特定的量就稱為統計量,用數學的術語說,統計量就是樣本的函式,它只依賴於樣本,不包含任何未知參數。根據樣本
,可以計算樣本均值樣本方差。樣本均值和樣本方差都是統計量,因為它們都是樣本的函式,且不含未知的參數。樣本統計量是隨著樣本不同而變化的量,由於樣本是隨機樣本,所以樣本統計量也是一個隨機變數。顯然,樣本均值 隨著抽取的樣本不同而變化,是一個隨機變數,既然是一個隨機變數就有一定的機率分布,我們把樣本統計量的分布稱作抽樣分布
如上例,10萬台微型計算機是我們研究的總體,隨機抽取的100台組成一個樣本,由於任意100台都可組成一個樣本,所以被抽中的100台是一個隨機樣本,由樣本計算的均值(方差成數等)也是隨機變數,這些由樣本計算的特徵值,稱為樣本統計量

樣本分布函式

總體的分布函式稱為總體分布函式.從總體中抽取容量為n的樣本,得到n個樣本觀測值,設其中互不相同的觀測值由小到大依次為, 則有頻率分布表,其中和式是對小於x的一切的頻率求和。
樣本分布函式的性質
(1)
(2)是非減函式
(3)
(4)在每個觀測值處左連續,且在跳躍間斷點處的躍度等於頻率.

相關概念

心理學概念

心理兩核心包括樣本和丘覺,是原理心理學的最核心概念。
外界客觀事物在腦中是以樣本的形式表示的,樣本是事物在腦中的符號,廣泛分布在大腦、下丘腦杏仁核、紋狀體、小腦及其他神經結構中。樣本與人腦功能密切相關,人腦的主要功能就是存儲樣本和進行樣本分析,樣本是人腦分析的工具。大腦樣本的形成、分布、分析都遵循中心擴散規律,以大腦的信息傳入區(如視區、聽區、軀體感覺區)為中心,樣本從籠統到精細向外擴散,離中心越遠樣本越精細;向外擴散的方向不同,樣本的內容也就不同,方向差異越大內容差異越大。分析也是從中心開始向外擴散,由籠統趨於精細。中心擴散規律是主要適用後天建立的樣本,如大腦樣本,初生嬰兒在與客觀事物接觸的過程中,只能形成模糊認識,建立籠統樣本,進行簡單分析,然後通過學習一步一步趨向精確,建立以信息傳入區為中心向外精細的樣本,大腦各區域的分析功能也是以信息傳入區為中心向外逐步精確。當眼、耳等感覺器官接收的信息傳到大腦感覺區,大腦使用已有樣本一步一步進行分析,整理一個相符的樣本並激活的這個樣本,點亮丘覺產生意識。
對客觀事物的意識,樣本、聯結都是後天建立的,出生嬰兒既不能認識客觀事物,也不能進行行為活動,需要通過學習建立代表客觀事物的樣本,樣本的建立是在與環境的不斷接觸中逐步形成的,初生嬰兒接觸什麼樣的客觀事物,就會建立什麼樣的樣本,樣本的建立遵循中心擴散規律,從無到有、從簡單到複雜逐步形成。大腦頂枕顳葉中建立的是表示客觀事物本身意義的樣本;紋狀體小腦中建立的是控制運動的樣本,這個樣本實質上就是運動控制程式、指令;但不是所有的樣本都是後天建立的,像情緒、欲望、動機這類的樣本就是先天就有的,是下丘腦、杏仁核的樣本;還有一些樣本是非常簡單的,也可以直接點亮丘覺。如一些感覺器官接受的外界信息。
樣本是人腦分析的工具,建立樣本的目的就是用於分析事物。大腦、下丘腦、杏仁核、紋狀體、小腦等結構即是樣本的存儲結構,又是樣本的分析結構,大腦、下丘腦、紋狀體是主要的分析結構,稱為分析中心。當我們看到或聽到外界事物時,分析中心使用已經建立的樣本分析事物,獲得一個與事物相符的樣本並激活這個樣本,激活的樣本點亮丘覺產生意識。分析過程遵循中心擴散規律,由簡單走向複雜,對事物的意識也是由簡單過渡到複雜。  樣本:對於產品樣本來說,樣本就是產品的宣傳資料。包括產品的外形尺寸、選型資料、基本概況等等。 例如:電氣產品樣本,機械產品樣本。

統計學概念

總體中抽取的所要考查的元素總稱,樣本中個體的多少叫樣本容量

相關詞條

熱門詞條

聯絡我們