機率抽樣:簡介,原則,原理,優缺點,要求,方法,簡單隨機抽樣,等距抽樣,分層抽樣,

機率抽樣是指在調查總體樣本中的每個單位都具有同等可能性被抽中的機會。又稱隨機抽樣，機率抽樣以機率理論和隨機原則為依據來抽取樣本的抽樣，是使總體中的每一個單位都有一個事先已知的非零機率被抽中的抽樣。總體單位被抽中的機率可以通過樣本設計來規定，通過某種隨機化操作來實現，雖然隨機樣本一般不會與總體完全一致。

基本介紹

中文名：機率抽樣
外文名：probability—sampling)
優點：調查者可獲得被抽取的不同年齡
要求：隨機性
方法：機率抽樣包括有簡單隨機抽樣
所屬領域：數理統計

簡介,原則,原理,優缺點,要求,方法,簡單隨機抽樣,等距抽樣,分層抽樣,整群抽樣,系統抽樣,

簡介

機率抽樣又稱隨機抽樣(probability—sampling)，即在抽樣時，母體中每一個抽樣單位被選人樣本的機率相同。隨機抽樣具有健全的統計理論基礎，可用機率理論加以解釋，是一種客觀而科學的抽樣方法。

一般而言，機率抽樣調查的基本組織形式分為單階段抽樣和多階段抽樣兩大類。單階段抽樣是指只需一次的抽樣過程，它有以下四種：簡單隨機抽樣、等距抽樣、分層抽樣、整群抽樣。多階段抽樣是指將總體分層、再逐層抽取樣本的過程。多階段抽樣在總體特別大時使用。不管哪種隨機抽樣，樣本必須始終被看作總體的近似而不是總體自身。

機率抽樣是一種數理統計學上的專業化術語。它是指根據隨機性理論在單位樣本量中抽取同樣數目的樣本作為研究對象。理論上講，每個樣本被抽中的機率相等，這樣就保證了抽選樣本中沒有摻雜所謂的人為因素。機率抽樣是定量研究中的基本抽樣方式，也是定量研究效度的體現方式機率抽樣的具體抽樣方法還有很多。簡單隨機
抽樣法、系統抽樣法以及分層抽樣法等。總體而言，建立在數學機率理論基礎上的機率抽樣方法有著無可避免的自然科學化的傾向。在一般情況下的定性研究中。研究者較少使用這種抽樣方式選取研究對象。

但它所依據的是大數定律,而且能計算和控制抽樣誤差,因此可以正確地說明樣本的統計值在多大程度上適合於總體,根據樣本調查的結果可以從數量上推斷總體,也可在一定程度上說明總體的性質,特徵.機率抽樣主要分為簡單隨機抽樣,系統抽樣,分類抽樣,整群抽樣,多階段抽樣等類型.現實生活中絕大多數抽樣調查都採用機率抽樣方法來抽取樣本。

原則

機率抽樣的基本原則是：樣本量越大，抽樣誤差就越小，而樣本量越大，則成本就越高。根據數理統計規律，樣本量增加呈直線遞增的情況下（樣本量增加一倍，成本也增加一倍），而抽樣誤差只是樣本量相對增長速度的平方根遞減。因此，樣本量的設計並不是越大越好，通常會受到經濟條件的制約。

原理

機率抽樣之所以能夠保證樣本對總體的代表性，其原理就在於它能夠很好的按總體內在結構中所蘊含的各種隨機事件的機率來構成樣本，使樣本成為總體的縮影。

優缺點

⑴ 機率抽樣包括以下幾個方面的優點：

調查者可獲得被抽取的不同年齡、不同層次的人們的信息；能估算出抽樣誤差；調查結果可以用來推斷總體。例如，在一項使用機率抽樣法的調查中，如果有 5 %的被訪者給出了某種特定回答，那么，調查者就可以以此百分比再結合抽樣誤差，推及總體情況。

⑵ 另一方面，機率抽樣也有一些弊病：

－在大多數案例中，同樣規模的機率抽樣的費用要比非機率抽樣高；

－機率抽樣比非機率抽樣需要更多時間策劃和實施；

－必須遵守的抽樣計畫執行程式會大量增加收集資料的時間。

下面，我們將介紹幾種友邦顧問最常採用的機率抽樣技術。

要求

機率抽樣應滿足的要求是：

隨機性——總體中的所有個體都有同樣被抽出的機會。

可行性——抽樣的方法在實際中是可實施的。

信息性——抽得的樣本儘可能反映出分析時所期望的各種信息。

方法

機率抽樣包括有簡單隨機抽樣、系統抽樣（等距抽樣）、分層抽樣（類型抽樣）、整群抽樣、多段抽樣、PPS抽樣和戶內抽樣。例如：

簡單隨機抽樣

簡單隨機抽樣是一種廣為使用的機率抽樣方法。是最完全的機率抽樣。如前面提到的，隨機抽樣就是總體中每個單位在抽選時有相等的被抽中的機會。

在簡單隨機抽樣條件下，抽樣機率公式為：

抽樣機率=樣本單位數∕總體單位數

例如，如果總體單位數為 10000 ，樣本單位數為 400 ，那么抽樣機率為 4 %。

簡單隨機抽樣的優點在於，它看起來簡單，並且滿足機率抽樣的一切必要的要求，保證每個總體單位在抽選時都有相等的被抽中的機會。簡單隨機抽樣可以通過電話隨機撥號功能完成這個步驟，可以從電腦檔案中挑選調查對象。

同樣，簡單隨機抽樣會遇到“樣本可能分布不均勻”以及“沒有好的抽樣框”等問題。

友邦顧問在簡單隨機抽樣過程中常使用的技巧為“抽籤法”和“隨機表”法。

等距抽樣

在定量抽樣調查中，等距抽樣常常代替簡單隨機抽樣。由於該抽樣方法簡單實用，所以套用普遍。等距抽樣得到的樣本幾乎與簡單隨機抽樣得到的樣本是相同的。

等距抽樣的基本做法是，將總體中的各單元先按一定的順序排列、編號，然後決定一個間隔，並在此間隔基礎上選擇被調查的單位個體。

樣本距離可通過下面公式確定：

樣本距離 =總體單位數∕樣本單位數

例如，假設你使用本地電話本並確定樣本距離為 100 ，那么 100 箇中取 1 個組成樣本。這個公式保證了整個列表的完整性。

等距抽樣方式隨意用一個起點，例如，如果你把一本電話本作為抽樣框，必須隨意取出一個號碼決定從該頁開始翻閱。假設從第 5 頁開始，在該頁上再另選一個數決定從該行開始。假定選擇從第 3 行開始，這就決定了實際開始的位置。

等距抽樣方式相對於簡單隨機抽樣方式最主要的優勢就是經濟性。等距抽樣方式比簡單隨機抽樣更為簡單，花的時間更少，並且花費也少。使用等距抽樣方式最大的缺陷在於總體單位的排列上。一些總體單位數可能包含隱蔽的形態或者是“不合格樣本”，調查者可能疏忽，把它們抽選為樣本。

分層抽樣

定量調查中的分層抽樣是一種卓越的機率抽樣方式，在友邦公司以往的調查中經常被使用。

又稱分類抽樣或類型抽樣。分層抽樣是先將總體的單位按某種特徵分為若干次級總體（層），然後再從每一層內進行簡單隨機抽樣，組成一個樣本。分組減小了各抽樣層變異性的影響，抽樣保證了所抽取的樣本具有足夠的代表性。可以提高總體指標估計值的精確度。

分層抽樣的具體程式是：把總體各單位分成兩個或兩個以上的相互獨立的完全的組（如男性和女性），從兩個或兩個以上的組中進行簡單隨機抽樣，樣本相互獨立。

總體各單位按主要標誌加以分組，分組的標誌與我們關心的總體特徵相關。例如，我們正在進行有關啤酒品牌知名度方面的調查，初步判別，在啤酒方面男性的知識與和女性不相同，那么性別應是劃分層次的適當標誌。如果不以這種方式進行分層抽樣，分層抽樣就得不到什麼效果，花再多時間、精力和物資也是白費。

分層抽樣與簡單隨機抽樣相比，我們往往選擇分層抽樣，因為它有顯著的潛在統計效果。也就是說，如果我們從相同的總體中抽取兩個樣本，一個是分層樣本，另一個是簡單隨機抽樣樣本，那么相對來說，分層樣本的誤差更小些。另一方面，如果目標是獲得一個確定的抽樣誤差水平，那么更小的分層樣本將達到這一目標。

在調查實踐中，為提高分層樣本的精確度實際上要付出一些代價。通常，我們現實正確的分層抽樣一般有三個步驟：

首先，辯明突出的（重要的）人口統計特徵和分類特徵，這些特徵與所研究的行為相關。例如，研究某種產品的消費率時，按常理認為男性和女性有不同的平均消費比率。為了把性別作為有意義的分層標誌，調查者肯定能夠拿出資料證明男性與女性的消費水平明顯不同。用這種方式可識別出各種不同的顯著特徵。調查表明，一般來說，識別出 6 個重要的顯著特徵後，再增加顯著特徵的辨別對於提高樣本代表性就沒有多大幫助了。

第二，確定在每個層次上總體的比例（如性別已被確定為一個顯著的特徵，那么總體中男性占多少比例，女性占多少比例呢？）。利用這個比例，可計算出樣本中每組（層）應調查的人數。

最後，調查者必須從每層中抽取獨立簡單隨機樣本。

整群抽樣

以上各種抽樣類型全部是按單位抽取的，即按樣本單位數，分別一個單位一個單位地抽取。在整群抽樣中，樣本是一組單位一組單位地抽取。

整群抽樣有兩個關鍵步驟：

－同質總體被分為相互獨立的完全的較小子集。

－隨機抽選子集構成樣本。

如果調查者在抽中的子集中觀察全部單位，我們就有了一級整群樣本。如果在抽中的子集中再以機率方式抽取部分單位觀察，我們就有了二級整群樣本。分層和整群抽樣都要將總體分為相互獨立的完全子集。它們的區別是，分層抽樣的樣本是從每個子集中抽取，而整群抽樣則是抽取部分子集。

地理區域抽樣是整群抽樣的典型方式。挨門挨戶去調查一個特定城市的調查者也許會隨機抽選一些區域，較集中地訪查一些群體，大量減少訪問時間和經費。整群抽樣被認為是機率抽樣技術，因為它隨機抽出群和隨機抽出單位。值得注意的是，在整群抽樣下，我們假定群中單位與總體一樣存在異質性。如果一群中單位的特徵非常相似，如果由於共同環境使群內差異小而群與群之間差異大。一般來說，要解決這個問題可以擴大群數，然後從各群中抽取少量單位數，以保證樣本的代表性。

系統抽樣

使用系統抽樣(systematic sampling)時，調研人員首先選取一個隨機的起點，然後連續地在抽樣框架中每隔i個個體就選出一個樣本。其選取樣本的間隔i被稱作抽樣間距(sampling interval)。它是由總體大小N除以樣本量聹的結果四舍五人後得出的。例如．假設總體中共有100 000個個體，樣本量大小為l 000。在這一情況下，抽樣間距為100，即從1至100之間隨機選擇一個數字。如果選取的是數字23，那么樣本就包括個體23、123、223、323、423、523等。

使用系統抽樣方法時，調研人員通常會按照某一方式把總體中的個體進行排列。如果電話簿被用作抽樣框架，其中的個體就會被按照首字母順序進行排列。在一些情況下，這一順序也許會與調研人員感興趣的某些特徵有關。例如，調研人員可能會按照未償還餘額對信用卡使用者進行排列，或按照年銷售額對某一行業內的公司進行排列。當調研人員按照與某些被調研的特徵有關的方式對個體進行排列時，利用系統抽樣獲得的抽樣結果會與利用SRS獲得的抽樣結果存在很大的不同。如果對一份按銷售額遞增順序排列的公司名單進行系統抽樣，那么所得到的樣本就既包括大型公司也包括小型公司。相比之下，利用簡單隨機抽樣所得到的樣本就缺乏代表性。例如，使用簡單隨機抽樣時．調研人員所得到的樣本可能只包含小型公司，或者包含較少數量的小型公司。

在使用系統抽樣時，如果抽樣框架被設計成循環結構，那么其樣本的代表性就會降低。假如使用系統抽樣。從包含60年以來每個月月銷量的抽樣框架中可以產生出一個商場月銷量的抽樣。如果抽樣間隔為12，那么最終的抽樣則不會反映月銷量的變化情況。

系統抽樣要比SRS更加經濟和簡單，因為隨機選擇的過程只有一次。此外．系統抽樣也不需要了解抽樣框架的構成。例如，每第i個離開商場或商店的顧客都可以被攔截。由於以上原因，系統抽樣經常被套用於顧客郵件、電話和商場攔截式訪談。下面的例子就很好地說明了這一點。

機率抽樣