中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

您當(dāng)前的位置:檢測資訊 > 生產(chǎn)品管

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

嘉峪檢測網(wǎng)        2020-01-10 11:00

我經(jīng)常會被問到這么一個問題:樣本量多大就不用進(jìn)行正態(tài)性檢驗了。殊不知,這問題的本身就是錯誤的,并不是樣本大,就一定要服從正態(tài)分布。我們可以輕易舉出一個反例來說明這個問題。比方說就用1-1000這一千個(甚至更多)自然數(shù),組成一個樣本,那么這個樣本的分布就不是正態(tài)分布,因為1-1000服從的是均勻分布。另外,數(shù)據(jù)的分布基于形成的機理,有的分布天生就非正態(tài)(如壽命數(shù)據(jù))。

 

但有些朋友,并不覺得這是一個錯誤的問題,甚至在他們的學(xué)習(xí)中還流傳著這么一個說法:樣本量大于30就可以認(rèn)為是服從正態(tài)分布。當(dāng)你向他問為什么的時候,會得到一個專業(yè)的解釋——中心極限定理。

 

 

中心極限定理

中心極限定理(Central Limit Theorem)是統(tǒng)計學(xué)中最重要的結(jié)論之一。在這里,我并不想給出中心極限定理專業(yè)的定義,只需要了解它告訴我們:來自某總體的一個樣本,無論該總體服從什么分布,只要樣本容量足夠大,其樣本均值都近似服從正態(tài)分布。

 

請注意這里的說法:“樣本均值“近似正態(tài),而不是樣本本身服從正態(tài)(不是說你抽了30個樣品組成的樣本數(shù)據(jù)就正態(tài))。這里又有一個大家疑惑的地方,樣本容量足夠大,多大才是足夠大?這個問題的答案和總體分布的形狀相關(guān),如果樣本本是來自近似對稱分布的總體,那么當(dāng)樣本量取相當(dāng)?。ㄈ鐦颖玖咳?)的值的時候,正態(tài)逼近的結(jié)果也會非常好。然后,如果總體的分布嚴(yán)重傾斜,則樣本量必須取相當(dāng)大的值。根據(jù)檢驗,對于大多數(shù)總體來說,樣本容量取30或者更大,就足以得到令人滿意的正態(tài)逼近結(jié)果。我想這可能就是錯誤認(rèn)為樣本量大于30就認(rèn)為是正態(tài)分布的出處了。

 

 

模擬擲骰子展示中心極限定理

 

為了展示中心極限定理,模擬多次投擲骰子來說明。

 

假設(shè)您擲骰子 1000 次。您希望得到相等數(shù)目的 1、2 等。讓我們查看 1000 次骰子的分布(圖1)。

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

現(xiàn)在假設(shè)您將投擲 2 次,并采用兩次投擲的平均值。您還將重復(fù)此試驗 1000 次。讓我們來看看兩次投擲的平均值的分布。這種分布如圖 2 所示。您是否注意到在只進(jìn)行了兩次投擲的情況下,平均值的分布已經(jīng)呈現(xiàn)出了土堆形?

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

假設(shè)您現(xiàn)在投擲骰子三次,然后取三次投擲的平均值。再次重復(fù)此試驗 1000 次。讓我們來看看此舉對投擲的平均值分布有何影響。這種分布如圖 3 所示。同樣,分布的形狀與正態(tài)分布的形狀相當(dāng)接近。您是否注意到分布上發(fā)生了其他變化?

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

讓我們投擲骰子五次,并取其平均值。再次重復(fù)此試驗 1000 次。這種分布如圖 4 所示。您是否已開始注意到所發(fā)生的情形中存在任何模式?

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

讓我們繼續(xù)增加平均投擲次數(shù)。此時您將投擲 10 次,并采用 10 次投擲的平均值。這種分布如圖 5 所示。

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

現(xiàn)在,隨著您增加投擲次數(shù),將看到兩個現(xiàn)象。首先,您會看到,平均分布的形狀開始與正態(tài)分布的形狀相似。其次,您會看到,隨著投擲次數(shù)的增加,分布變得越來越窄。讓我們繼續(xù)增加投擲次數(shù)。此時,您將投擲骰子 20 次。這種分布如圖 6 所示。

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

到現(xiàn)在,您應(yīng)該確信增大樣本數(shù)量對樣本平均值分布是有影響的。您將再次增大樣本數(shù)量,以強化這種認(rèn)知。此時,您將投擲骰子 30 次。這種分布如圖 7 所示。

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

讓我們看看所呈現(xiàn)的情況,在一個圖中繪制大小為 2、5、10、20、30 的樣本的直方圖,以查看變化的分布。

樣本量大于30就可以認(rèn)為是正態(tài)分布嗎?你可能對中心極限定理有誤區(qū)!

 

 

 小 結(jié) 

 

從上面的模擬結(jié)果,可以知道,當(dāng)樣本量大于30的時候,那么樣本均值(取了1000次樣本,得到1000個均值)的分布基本呈正態(tài)分布。

 

另外該定理還指出,如果根據(jù)總體不斷重復(fù)繪制隨機樣本數(shù)量 n 以及有限均值 mu(y) 和標(biāo)準(zhǔn)差 sigma(y),然后在 n 較大時,樣本均值的分布將近似呈正態(tài)分布,并且均值等于 mu(y),標(biāo)準(zhǔn)差等于 (sigma(y))/sqrt(n)。

 

分享到:

來源:何茂林MinitabUsersGroup

相關(guān)新聞: