等距抽樣(系統抽樣)

等距抽樣

系統抽樣一般指本詞條

先將總體的全部單元按照一定順序排列,採用簡單隨機抽樣抽取第一個樣本單元(或稱為隨機起點),再順序抽取其餘的樣本單元,這類抽樣方法被稱為等距抽樣(Systematic Sampling)。等距抽樣又稱為機械抽樣、系統抽樣。等距抽樣往往不能給出估計量的估計方差。

基本介紹

  • 中文名:等距抽樣
  • 外文名:Systematic Sampling
  • 別稱:系統抽樣、機械抽樣、SYS抽樣
  • 套用學科:數學
  • 適用領域範圍:抽樣調查
  • 分類:直線、對稱、循環等距抽樣
  • 特點:總體中是均勻分布的,抽取樣本少
簡介,分類,特徵,要求,樣本容量,優缺點,調查套用,抽樣方法,排序方法,

簡介

分類

根據總體單位排列方法,等距抽樣的單位排列可分為三類:按有關標誌排隊、按無關標誌排隊以及介於按有關標誌排隊和按無關標誌排隊之間的按自然狀態排列。按照具體實施等距抽樣的作法,等距抽樣可分為:直線等距抽樣、對稱等距抽樣和循環等距抽樣三種。
系統抽樣分為間隔定時法、間隔定量法、分部比例法。

特徵

等距抽樣的特點是:抽出的單位在總體中是均勻分布的,且抽取樣本可少於純隨機抽樣。

要求

等距抽樣既可以用同調查項目相關的標誌排隊,也可以用同調查項目無關的標誌排隊。
等距抽樣要防止周期性偏差,因為它會降低樣本的代表性。例如,軍隊人員名單通常按班排列,10人一班,班長排第 1名,若抽樣距離也取10時,則樣本或全由士兵組成或全由班長組成。

樣本容量

(1)無序系統抽樣的樣本容量。若對總體採用按無關標誌排隊的等距抽樣時,可採用簡單隨機抽樣的樣本容量公式確定等距抽樣的樣本容量。由於等距抽樣一般都是不重複抽樣,故心採用簡單隨機抽樣中的不重複抽樣的樣本容量公式確定等距抽樣的樣本容量。
(2)有序系統抽樣的樣本容量。若對總體採用按有關標誌排隊的等距抽樣,則樣本容量的確定應根據以往的資料估計。層內方差的平均值。其樣本容量門的確定公式與簡單隨機抽樣樣本容最的確定公式堪本相同(只需用層內方差的平均值替換總體方差即可)。

優缺點

等距抽樣方式相對於簡單隨機抽樣方式最主要的優勢就是經濟性。等距抽樣方式比簡單隨機抽樣更為簡單,花的時間更少,並且花費也少。使用等距抽樣方式最大的缺陷在於總體單位的排列上。一些總體單位數可能包含隱蔽的形態或者是“不合格樣本”,調查者可能疏忽,把它們抽選為樣本。由此可見,只要抽樣者對總體結構有一定了解時,充分利用已有信息對總體單位進行排隊後再抽樣,則可提高抽樣效率。

調查套用

在定量抽樣調查中,等距抽樣常常代替簡單隨機抽樣。由於該抽樣方法簡單實用,所以套用普遍。等距抽樣得到的樣本幾乎與簡單隨機抽樣得到的樣本是相同的。
等距抽樣的基本做法是,將總體中的各單元先按一定的順序排列、編號,然後決定一個間隔,並在此間隔基礎上選擇被調查的單位個體。
樣本距離可通過下面公式確定:樣本距離 = 總體單位數∕樣本單位數
例如,你使用本地電話本並確定樣本距離為 100 ,那么 100 箇中取 1 個組成樣本。這個公式保證了整個列表的完整性。
等距抽樣方式隨意用一個起點,例如,如果你把一本電話本作為抽樣框,必須隨意取出一個號碼決定從該頁開始翻閱。假設從第 5 頁開始,在該頁上再另選一個數決定從該行開始。假定從第 3 行開始,這就決定了開始的位置。

抽樣方法

當總體單位的順序排列之後,可選用下列方法進行等距抽樣。
(1)隨機起點等距抽樣
即在總體分成K段(K=N/n)的前提下,首先從第一段的1至k號總體單位中隨機抽選一個樣本單位,然後每隔k個單位抽取一個樣本單位,直到抽足n個單位為止。這n個單位就構成了一個隨機起點的等距樣本。這種方法能夠保證各個總體單位具有相同的機率被抽到,但是,如果隨機起點單位處於每一段的低端或高端,就會導致往後的單位都會處於相應段的低端或高端,從而使抽樣出現偏低或偏高的系統誤差。
(2)半距起點等距隨機抽樣
這種方法又稱為中點法抽取樣本,它是在總體的第一段,取1,2,…,k號中的中間項為起點,然後再每隔k個單位抽取一個樣本單位,直到抽足n個樣本單位為止。當總體是按有關標誌的大小順序排列時,採用中點法抽取樣本,可提高整個樣本對總體的代表性。
(3)隨機起點對稱等距抽樣
這種方法是在總體第一段隨機抽到第i個單位,而在第二段抽取第2k-f+1的單位,在第三段抽取第2k+f的單位,而在第四段抽取第4k-f+1的單位…,以此交替對稱進行。可概括為:在總體奇數段抽取第jk+i單位(j=0,2,4…);在總體偶數段抽取第jk-i+1單位(j=2,4…)。這種抽樣方法能使處於低端的樣本單位與另一段處於高端的樣本單位相互搭配,從而抵消或避免抽樣中的系統誤差。
(4)循環等距抽樣
當N為有限總體而且不能被n所整除,亦即k不是一個整數時,可將總體各單位按順序排成首尾相接的循環圓形,用N/n確定抽樣間隔k,k可以取最接近的整數,然後在第一段的1至後號中抽取一個作為隨機起點,再每隔後個單位抽取一個樣本單位,直至抽滿行個為止。

排序方法

採用等距抽樣時,必須首先對總體單位按某種標誌進行排序,有下列兩種排序方法。
(1)按無關標誌排序
即總體單位排列的順序和所要研究的標誌是無關的。如調查職工的收入水平,可按姓氏筆劃排列的職工名單進行抽樣;工業生產質量檢驗可按產品生產的時間順序進行等距抽樣等等。一般認為,按無關標誌排隊的等距抽樣是一種抽籤法,隨機數表法更好的純隨機抽樣方式,又稱無序系統抽樣。
(2)按有關標誌排序
即總體單位排列的順序與所要研究的標誌是有直接關係的。例如,農產量抽樣調查時,可按照當年估產或前幾年的平均實產由低到高或由高到低的順序進行抽樣。這種按有關標誌排隊的等距抽樣又稱有序系統抽樣,它能使標誌值高低不同的單位,均有可能選入樣本,從而提高樣本的代表性,減小抽樣誤差。一般認為有序系統抽樣比等比例分層抽樣能使樣本更均勻地分布在總體中,抽樣誤差也更小。

相關詞條

熱門詞條

聯絡我們