中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

您當(dāng)前的位置:檢測資訊 > 生產(chǎn)品管

質(zhì)量工具講解 | 抽樣調(diào)查中樣本容量的確定方法

嘉峪檢測網(wǎng)        2017-07-14 09:16

一、樣本單位數(shù)量的確定原則 

一般情況下,確定樣本量需要考慮調(diào)查的目的、性質(zhì)和精度要求。以及實際操作的可行性、經(jīng)費承受能力等。根據(jù)調(diào)查經(jīng)驗,市場潛力和推斷等涉及量比較嚴格的調(diào)查需要的樣本量比較大,而一般廣告效果等人們差異不是很大或?qū)颖玖恳蟛皇呛車栏竦恼{(diào)查,樣本量相對可以少一些。實際上確定樣本量大小是比較復(fù)雜的問題,即要有定性的考慮,也要有定量的考慮;從定性的方面考慮,決策的重要性、調(diào)研的性質(zhì)、數(shù)據(jù)分析的性質(zhì)、資源、抽樣方法等都決定樣本量的大小。但是這只能原則上確定樣本量大小。具體確定樣本量還需要從定量的角度考慮。 

 

從定量的方面考慮,有具體的統(tǒng)計學(xué)公式,不同的抽樣方法有不同的公式。歸納起來,樣本量的大小主要取決于: 

(1)研究對象的變化程度,即變異程度;

(2)要求和允許的誤差大小,即精度要求; 

(3)要求推斷的置信度,一般情況下,置信度取為95%; 

(4)總體的大??; 

(5)抽樣的方法。 

  

也就是說,研究的問題越復(fù)雜,差異越大時,樣本量要求越大;要求的精度越高,可推斷性要求越高時,樣本量也越大;同時,總體越大,樣本量也相對要大,但是,增大呈現(xiàn)出一定對數(shù)特征,而不是線形關(guān)系;而抽樣方法問題,決定設(shè)計效應(yīng)的值,如果我們設(shè)定簡單隨機抽樣設(shè)計效應(yīng)的值是1;分層抽樣由于抽樣效率高于簡單隨機抽樣,其設(shè)計效應(yīng)的值小于1,合適恰當(dāng)?shù)姆謱?,將使層?nèi)樣本差異變小,層內(nèi)差異越小,設(shè)計效應(yīng)小于1的幅度越大;多階抽樣由于效率低于簡單隨機抽樣,設(shè)計效應(yīng)的值大于1,所以抽樣調(diào)查方法的復(fù)雜程度決定其樣本量大小。對于不同城市,如果總體不知道或很大,需要進行推斷時,大城市多抽,小城市少抽,這種說法原則上是不對的。實際上,在大城市抽樣太大是浪費,在小城市抽樣太少沒有推斷價值。

 

  二、樣本量的確定方法 

如何確定樣本量,基本方法很多,但是公式檢驗表明,當(dāng)誤差和置信區(qū)間一定時,不同的樣本量計算公式計算出來的樣本量是十分相近的,所以,我們完全可以使用簡單隨機抽樣計算樣本量的公式去近似估計其他抽樣方法的樣本量,這樣可以更加快捷方便,然后將樣本量根據(jù)一定方法分配到各個子域中去。所以,區(qū)域二相抽樣不能計算樣本量的說法是不科學(xué)的。

 

1.簡單隨機抽樣確定樣本量主要有兩種類型:   

(1)對于平均數(shù)類型的變量 

對于已知數(shù)據(jù)為絕對數(shù),我們一般根據(jù)下列步驟來計算所需要的樣本量。已知期望調(diào)查結(jié)果的精度(E), 期望調(diào)查結(jié)果的置信度(L),以及總體的標準差估計值σ的具體數(shù)據(jù),總體單位數(shù)N。 

 

計算公式為:n=σ2/(e2/Z2+σ2/N) 

 

特殊情況下,如果是很大總體,計算公式變?yōu)?n= Z2σ2/e2

 

例如:希望平均收入的誤差在正負人民幣30元之間,調(diào)查結(jié)果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計量為1.96。根據(jù)估計總體的標準差為150元,總體單位數(shù)為1000。 

 

樣本量:

n=150*150/(30*30/(1.96*1.96))+150*150/1000)=88 

 

(2)于百分比類型的變量 

對于已知數(shù)據(jù)為百分比,一般根據(jù)下列步驟計算樣本量。已知調(diào)查結(jié)果的精度值百分比(E),以及置信度(L),比例估計(P)的精度,即樣本變異程度,總體數(shù)為N。 

 

則計算公式為:n=P(1-P)/(e2/Z2+ P(1-P)/N) 

 

同樣,特殊情況下如果不考慮總體,公式為:n= Z2P(1-P)/e2   

 

一般情況下,我們不知道P的取值,取其樣本變異程度最大時的值為0.5。 

 

例如:希望平均收入的誤差在正負0.05之間,調(diào)查結(jié)果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計量為1.96,估計P為0.5,總體單位數(shù)為1000。

 

樣本量為:

n=0.5*0.5/(0.05*0.05/(1.96*1.96)+0.5*0.5/1000)=278 

 

2.樣本量分配方法 

以上分析我們獲得了采用簡單隨機抽樣公式計算得到的樣本量,總的樣本量需要在此基礎(chǔ)上乘以設(shè)計效應(yīng)的值得到。由于樣本總量已經(jīng)確定,我們采用總樣本量固定方法分配樣本,這種方法包括按照比例分配和不按照比例分配兩類。實際工作中首先計算取得區(qū)縣總的樣本量,然后逐級將其分配到各階分層中,如果不清楚各階分層的規(guī)模和方差等,一般采取比例分配或者比例平方根分配法。如果有一定輔助變量可以使用,可以采用按照規(guī)模分配法分配樣本量。 

  

3.樣本量和總體大小的關(guān)系: 

在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總體的大小而變化。但是,總體越大,其變化越不明顯;總體較小時,變化明顯。其變化趨勢如下:   

  

二者之間的變化并非是線性關(guān)系。所以,樣本量并不是越大越好,應(yīng)該綜合考慮,實際工作中只要達到要求就可以了。   

 

三、抽樣調(diào)查方案樣本量的確定 

我們決定首先采取簡單隨機抽樣的方法計算區(qū)縣的樣本量,之所以首先對區(qū)縣計算樣本量,主要是考慮,雖然我們方案中沒有要求對區(qū)縣的估計量,但是區(qū)縣一級是我們做計劃和決策的基礎(chǔ),具有承上啟下的作用,如果區(qū)縣級獲得的估計量精度比較高,就可以保證上一級的估計量具有更高的精度,而且各個區(qū)縣的樣本量可以認為是相同的,這主要是因為各個區(qū)縣的總體數(shù)都比較多,而且我們也不清楚;同時也不可能事先進行區(qū)縣方差估計。沒有首先計算區(qū)縣以下各階分層的樣本量,主要是考慮: 

(1)如果計算區(qū)縣以下某階分層的樣本量,然后再將計算的樣本量合并,將顯著增加樣本量,增加基層的負擔(dān)。 

 

(2)事實上,對于計算階可以比較好的得到它的估計量,但我們現(xiàn)在不需要得到區(qū)縣以下各階分層的估計量,我們僅僅需要區(qū)縣的估計量,沒有必要計算區(qū)縣以下階樣本量。   

 

(3)我們直接對整個區(qū)縣以簡單隨機抽樣進行抽取,然后將其樣本量合理分配到各階分層中,這樣可以使用較少樣本量得到區(qū)縣較好的估計量。 

  

以下我們以試點地區(qū)批零業(yè)為對象進行研究。由于沒有誤差限以及置信度和抽樣比率的值。我們可以采用常用參數(shù):設(shè)定區(qū)縣總體為很大,置信度是95%,抽樣比率保守估計是0.5,抽樣誤差不能大于15%,根據(jù)公式計算得到樣本量為43個。由于采取多階分層抽樣,我們?nèi)绾卧O(shè)定抽樣設(shè)計效應(yīng)呢?區(qū)縣及以下是三階分層抽樣,只要在各階進行合適的分層,其設(shè)計效應(yīng)應(yīng)該在2-3之間,我們在這里取保守值3,那么得到本區(qū)縣樣本量是129個,這個樣本量就可以根據(jù)新方案得到區(qū)縣要求誤差內(nèi)的估計值。   

 

1.確定辦事處、居委會、村委會樣本量 

根據(jù)方案,每個居委會抽取樣本5-10個,那么這個樣本量是否可行呢?這里涉及如何將區(qū)縣樣本分配到街道和居委會中去,根據(jù)方案要求,街道抽取采取先分層,后對層內(nèi)進行PPS抽樣;那么分配樣本是否也采取同樣方法呢?主要看輔助變量與樣本量之間的關(guān)聯(lián)程度,方案中提供了兩個輔助變量:人口數(shù)和個體數(shù),對于輔助變量是個體數(shù)的完全可以使用規(guī)模分配方法分配樣本量,個體數(shù)多的分配較多的樣本量;對于輔助變量是人口數(shù)的如果采

取規(guī)模分配方法,由于人口數(shù)與一個地區(qū)的個體單位數(shù)沒有必然的聯(lián)系,可能導(dǎo)致某些居委會的個體數(shù)比較多,卻分配了較少的樣本量,使得居委會分層變的困難,同時使居委會方差顯著增大。而獲得較多樣本量的居委會,分層的效果和方差提高幅度有限,故采用比例分配的方法可能更加合適一些。對于居委會村委會的抽取,由于本階可能存在市場內(nèi)的抽樣,分配復(fù)雜一些;如果本階有市場內(nèi)抽樣,可以適當(dāng)減少居委會村委會的樣本量,但應(yīng)該大于本階樣本量的80%,由于市場內(nèi)抽樣的特殊性,建議將本階樣本量全部分配給居委會村委會,我們所進行的試點就是將樣本全部分配給居委會;至于市場內(nèi)抽樣的具體實施,可以根據(jù)方案操作完成。對居委會村委會層內(nèi),由于使用簡單隨機抽樣完成,采用比例分配平均分配就可。 

  

在實際工作時,由于一個區(qū)縣包括全部鄉(xiāng)鎮(zhèn)街道或其中的一個;根據(jù)方案,區(qū)縣抽取辦事處的數(shù)量應(yīng)該介于12-4個之間,對應(yīng)于抽中鄉(xiāng)、鎮(zhèn)、街道的全部或其中一個,那么其每一個鄉(xiāng)鎮(zhèn)街道采取比例分配平均分配的樣本量應(yīng)該是11-32個之間;所抽中的居委會、村委會數(shù)量應(yīng)該介于16-48個之間,如果個別鄉(xiāng)鎮(zhèn)街道抽中的居委會是2個,則其居委會總數(shù)相應(yīng)減少一些;最后,每個居委會、村委會的樣本量應(yīng)該介于3-16個之間,大部分介于5-10之間。以上的討論沒有考慮總體的大小,如果考慮到居委會、村委會的總體有限,則每個居委會村委會的樣本量可以減少一些,具體可以采用以下公式得到具體樣本量的調(diào)整數(shù):   

樣本量n=n1*N/(N+n1)。N是本地區(qū)總體,n1 是給本地區(qū)分配樣本量   

居委會樣本量的調(diào)整數(shù),應(yīng)該作為本居委會樣本量的底限。   

 

確定辦事處、居委會村委會的樣本量,與以下幾點有關(guān):   

a)估計量的誤差、置信度,可以決定簡單隨機抽樣的樣本量 

b)與采用的抽樣方法有關(guān)系,它決定了設(shè)計效應(yīng)的大小。例如:分層抽樣的設(shè)計效應(yīng)值小于1,多階抽樣的設(shè)計效應(yīng)值大于1。可以決定整個抽樣的樣本量。 

c)與每一階的分層的數(shù)目有關(guān)系,所以,應(yīng)該重點考慮分層的問題,分層太多,沒有必要;分層太少,導(dǎo)致層內(nèi)的方差增大,可能影響估計值的精度以及設(shè)計效應(yīng)的值,所以,在每階分層時,應(yīng)該合理考慮,使得樣本的變異程度在層內(nèi)達到一個合理水平。 

  

根據(jù)以上原則,我們在包頭的抽樣試點共抽取4個辦事處,包括14個居委會;一個鄉(xiāng),包括4個村委會,經(jīng)過清查共有批零業(yè)1042個,單位70個;餐飲業(yè)250個,單位3個。由于我們使用人口數(shù)作為輔助變量,應(yīng)該采用比例分配方法平均分配樣本量,這樣每個街道辦事處得到26個樣本, 對于抽取4個居委會的辦事處,每個居委會分配得到7個樣本;對于抽取2個居委會的辦事處,每個居委會分配到13個樣本。然后根據(jù)居委會總體對樣本量做出調(diào)整,得到居委會實際樣本量。

 

2.確定居委會村委會內(nèi)分層樣本量 

以上我們討論如何分配給鄉(xiāng)鎮(zhèn)居委會村委會樣本量,現(xiàn)在分析給居委會村委會以下各層分配樣本量,這一步,清查的工作就顯得非常重要了,重點應(yīng)該清查規(guī)模、類別,首先是規(guī)模,規(guī)模的大小不應(yīng)該根據(jù)工商注冊為單位或個體決定,應(yīng)該根據(jù)實際情況,即使是個體,如果規(guī)模較大,也應(yīng)該歸入大規(guī)模分層中,這樣就可以使得每層的樣本變異程度顯著降低,從而提高精確度。根據(jù)實際情況可以包括兩種: 

 

(1)如果全部是規(guī)模比較小的單位個體戶,我們可以根據(jù)類別進行適當(dāng)?shù)姆纸M,將某一類單位比較多的單獨分層;將另外類別比較少的,可以幾類合并進行抽取具體樣本,分層不要多于4層,并保證每層的樣本量不小于2個。由于居委會樣本量數(shù)目已經(jīng)確定,我們可以直接采取比例分配方法,確定各層樣本量。 

 

(2)如果規(guī)模比較大的和規(guī)模小的并存,可以將規(guī)模比較大的單獨分層,不用考慮其中的類別;將規(guī)模較小的主要是個體戶可以根據(jù)類別進行分層;其中的難題是如何將樣本量在規(guī)模大的和規(guī)模小的之間分配,因為大規(guī)模層內(nèi)樣本變異程度有可能很大,應(yīng)該抽取較多的樣本量,經(jīng)過測試,如果大規(guī)模層總體小于等于5,應(yīng)該對其進行全面調(diào)查;如果大于5個,可以采用以下的公式計算得到: 

n=0.25/(e2/t2+ 0.25/N),其中:e=30%,t=2.1,N為規(guī)模較大的數(shù)目。 

  

其他規(guī)模較小的,使用比例分配法分配其他的樣本,實際分層時,最好不要超過4層,保證每層不少于2個,由于大規(guī)模層的存在,可能占去了較多的樣本量,導(dǎo)致其它層不夠分配,這種情況下,可考慮增加層內(nèi)一定樣本量。 

  

經(jīng)過以上的分析、計算可以得到居委會村委會的樣本數(shù)量。

 

分享到:

來源:AnyTesting

相關(guān)新聞: