3.分層隨機抽樣
(1)分層隨機抽樣的含義和優點。
分層隨機抽樣又稱類型隨機抽樣,是指根據調查目的確定一定的標誌,將調查總體按標誌分為若幹層次(或類型),然後在各層中采用單純隨機抽樣抽取樣本的一種抽樣方式。
分層隨機抽樣的優點:
①增強了樣本對總體的代表性。當總體內部類型明顯時,分層隨機抽樣能夠克服簡單隨機抽樣和等距抽樣的不足。
②分層隨機抽樣比簡單隨機抽樣和等距抽樣誤差都小。
③分層隨機抽樣還有利於了解總體各類別的情況。
當調查總體單位數量大,並且具有明顯的分層特征時,可以采用分層隨機抽樣。
(2)分層隨機抽樣的具體形式。
1)分層比例抽樣。分層比例抽樣是指按各個層的單位數量占調查總體單位數量的比例分配各層的樣本數量。當分層後,各層內各個子體之間差異較小(標準差小),且各層差異在總體差異中所占比例大小差別不太大的情況下,可以采用分層比例抽樣。
各層應該抽取的樣本數的計算公式如下:
ni=n·NiN
式中,N——總體單位數目;
Ni——第i層單位數目;
n——樣本總數;
ni——第i層樣本數目。
【例5-2】某地區有居民20000戶,從中抽選200戶家庭進行購買力調查。其中高收入戶居民家庭為4000戶,中收入戶家庭為12000戶,低收入戶家庭4000戶。用分層比例抽樣法確定各層的樣本數目。
按照收入這個標誌,將居民家庭分為高收入層、中收入層、低收入。則各層應抽取的樣本數目是:
從高收入層居民家庭應抽取的樣本數目:
n高=n·NiN=200×400020000=40(戶)
從中收入層居民家庭應抽取的樣本數目:
n中=n·NiN=200×1200020000=120(戶)
從低收入層居民家庭應抽取的樣本數目:
n低=n·NiN=200×400020000=40(戶)
2)分層最佳抽樣。分層最佳抽樣又稱為非比例抽樣。它是根據各層樣本標準差的大小,調整各層樣本數目的抽樣方式。在各層差異過分懸殊,每層內部各子體之間差異較大,某些層的重要性大於其他層的情況下,這些層抽取的樣本數就多;反之,抽取的樣本數就少。這種同時兼顧層的大小和差異程度的大小的抽樣方式,有利於降低各層及各層內部各子體之間的差異,能夠提高樣本的代表性。
采用分層最佳抽樣法,確定各樣本數目的計算公式如下:
ni=n·NiSi∑NiSi
式中:ni——第i層應抽出的樣本數目;
n——樣本總數目;
Ni——第i層的調查單位數;
Si——第i層調查單位的樣本標準差。
(3)最低成本抽樣。最低成本抽樣是在考慮各層所占比例大小和各層內各子體之間差異大小的基礎上,再根據各層子體的調查所需費用調整各層應抽取的樣本數。這種抽樣方法既考慮統計結果的準確性,也考慮經濟效果。如果各層所需要的調查費用差異較大,需要在不影響樣本代表性的前提下,調整各層樣本數目,使調查費用降低。
最低成本抽樣每層應該抽取樣本數的計算公式為
ni=Niσi/ci∑(Niσi/ci)×n
式中:ni——第i層抽出的樣本數;
Ni——第i層的總單位數;
σi——第i層的標準差;
ci——第i層每單位的調查費用;
N——總體樣本數。
【例5-3】某市有各類型書店500家,其中大型50家,中型150家,小型300家。為了調查該市圖書銷售情況,先計劃從中抽取30家書店進行調查,現假設對不同類型書店進行調查,每調查一家大型書店需要的調查費用為600元,中型書店需要500元,小型書店需要400元,其他情況不變。按照最低成本抽樣法應從各層中抽取多少家書店進行調查?
解:根據最低成本抽樣法,則
n大=(50×20000)/60050×20000600+150×8000500+300×5000400×30=7(家)
n中=(150×8000)/50050×20000600+150×8000500+300×5000400×30=9(家)
n小=(300×5000)/40050×20000600+150×8000500+300×5000400×30=14(家)
4.整群隨機抽樣
(1)整群隨機抽樣的含義。
整群隨機抽樣是將總體按一定標準劃分成群或集體,按隨機的原則從總體中抽取若幹群或集體,作為總體的樣本,並對被抽中各群中的每一個單位都進行實際調查的方式。分群隨機抽樣的群體的形成有兩種:一是人為地劃分群體,二是自然形成的群體(客觀存在的群體)。
【例5-4】某市有20萬戶居民,分為120個居民委員會,要抽選500戶居民做樣本,調查居民的糧食月消費量,如何從20萬戶中抽選樣本500戶?
具體步驟如下:
①將全市20萬戶居民按居民委員會分群,120個居民委員會,就是120個群。
②從120個群中,隨機抽出10個居民委員會(即10群)作為樣本。
③對被抽中各群中的每一個單位,即被抽中的居委會的每個居民都要被調查。
(2)分群隨機抽樣和分層隨機抽樣的比較。
①二者相似之處。分群隨機抽樣和分層隨機抽樣都是首先根據某種標準把調查總體分為若幹部分層或群。
②二者的區別。二者抽取樣本的做法不同。分層隨機抽樣必須在總體的每一個層次中,按照其比例抽取一定數量的樣本單位;而整群隨機抽樣則是將總體被抽取部分的全部單位作為樣本單位。
二者的內容要求不同。分層隨機抽樣要求所分各層之間有明顯差異性,同層內部的單位具有相同性;分群隨機抽樣恰恰相反,要求各群體之間具有相同性,同一群體內部的單位具有差異性。
(3)分群隨機抽樣的優缺點及適用情況。
抽取的樣本單位比較集中,調查起來比較便利,可以減少調查人員的旅途往返的時間,節省費用;在大規模市場調查中,特別是在不可能直接得到擬調查的樣本總體數量時,分群隨機抽樣的優點最為明顯,可以使研究者得到一個隨機的調查樣本。但是,樣本隻能集中在若幹群體中,不能均勻地分布在總體的各個部分中,因此用樣本推斷總體的準確性差。
當群體內各單位間的差異性大,而群與群之間差異較小時,采用分群隨機抽樣可以提高樣本的代表性。
三、抽樣誤差的計算與抽樣數目的確定
抽樣誤差的計算與抽樣數目的確定,是隨機抽樣調查中必須解決的問題。因為,隻有計算抽樣誤差和確定抽樣數目,才能把抽樣誤差控製在一定的範圍內,才能對調查總體進行比較準確的推斷。
(一)抽樣誤差的類型和含義
市場調查工作中講的誤差有兩種。
(1)調查誤差,指在調查統計工作中,由於工作上各種原因而產生的誤差。
(2)代表性誤差,指由於樣本結構與總體結構不一致,以樣本綜合指標推斷總體綜合指標所產生的誤差。
代表性誤差又有兩種情況:
(1)在抽樣過程中因違反隨機抽樣原則或抽樣方式不妥而造成的係統性誤差;
(2)由於樣本不能代表總體所產生的誤差,叫做偶然的代表性誤差。
我們所講的抽樣誤差是專門指偶然的代表性誤差。
代表性誤差又可表現為兩種情形:
(1)實際誤差,是指樣本綜合指標與總體相應綜合指標的實際偏差。
(2)平均誤差,即各種可能被抽中的樣本配合數的綜合指標同總體相應綜合指標的平均離差,它表明樣本指標同總體指標可能相差的範圍,而不是確切的誤差數值。