您當(dāng)前的位置:檢測資訊 > 監(jiān)管召回
嘉峪檢測網(wǎng) 2015-02-25 22:39
國家工商總局最近公布了抽查了各家網(wǎng)購平臺的抽檢結(jié)果,92件樣品38件非正品,而手機(jī)正品率更只有28%。央視報道的節(jié)目中說到,“9個電商平臺中,只有兩家沒有被檢出銷售假冒或質(zhì)量不合格的商品”。
這個結(jié)果挺要命,不到6成的正品率,叫大家怎么安心“剁手”。不過細(xì)心的人也發(fā)現(xiàn)了一個問題,9家網(wǎng)購平臺上的商品多的數(shù)不清,總共抽取92件,平均每家抽取10件商品檢測,得到的結(jié)果能否代表真實情況?并且,“非正品”也不等于“假冒”或是“質(zhì)量不合格”。再一看這次抽檢的詳情表,更是下巴都掉了下來。
ZOL商城欲哭無淚,總共就抽取了1個商品,不幸還是非正品,一下全軍覆沒。如果是一個普通的消費(fèi)者,他當(dāng)然可以說:“隨便買個東西就是假的,你家太差了!”但一個權(quán)威調(diào)查機(jī)構(gòu)也這樣,未免草率。
那么,一次有說服力的抽檢應(yīng)該是什么樣的?
隨便≠隨機(jī)
圖片來源:sunlogistics.fr
對于商品質(zhì)量抽檢而言,一個消費(fèi)者任意網(wǎng)購一件商品回來,檢測是否正品或者是否符合國家標(biāo)準(zhǔn),是否也能算作一次質(zhì)量檢測?當(dāng)然。他畢竟完成了一次抽樣。但是,這種行為叫做非概率抽樣,樣本總是限于主觀和容易獲取的部分。既不能確定抽樣誤差,也不能通過統(tǒng)計數(shù)據(jù)推斷整體。
非概率抽樣的方法有很多種,“先生耽誤您兩分鐘”的街頭攔人發(fā)調(diào)查問卷是個典型——這屬于方便抽樣——選取最容易抽取的樣本。其他還有比如判斷抽樣,盡管總體涉及到所有類別的所有商品,但僅通過個人判斷,選擇數(shù)個商品來描述整個樣本。
這種粗略和前期的探索,主要目的是用較低的成本做近似的估計。優(yōu)點是方便快捷省事,缺點是……缺點很多。
想要客觀地對總體的某些特征做出具備一定可靠性的推論,概率抽樣中最正式的抽樣方法——簡單隨機(jī)抽樣——是個好選擇。隨機(jī)抽樣要求總體中每個個體擁有相同的被抽中概率。當(dāng)總體非常大時,做到這點非常困難。
例如淘寶商品類別繁多,數(shù)量更加龐大。跑一遍人家的數(shù)據(jù)庫,隨機(jī)抽取太不現(xiàn)實。這種情況下,對簡單隨機(jī)抽樣做出改進(jìn)和簡化就很有必要。
系統(tǒng)抽樣是一種改進(jìn)方法,以固定的間隔每隔若干個體抽取一個樣本。另一種改進(jìn)方法是采用分層抽樣,按某種特征將要個體劃分成不同的層,然后按照簡單隨機(jī)抽樣方法從每一個層里抽取足夠的個體。
“層”就是某種劃分方法,例如人可以分成男、女兩層。每個層都是總體的一個子集,各層之間互相獨(dú)立。只有劃分出具有代表性的層后,抽樣才有意義。相比隨便點開一家店鋪購買一些商品用于檢測,根據(jù)信用等級等指標(biāo),先選出有代表性的商鋪,然后在商鋪中隨機(jī)挑選商品,是個更好一些的抽樣方法。
不同的樣本能混為一談嗎?

圖片來源:webseoanalytics.com
再說回到這次工商總局發(fā)布的監(jiān)測結(jié)果,不同的樣本其實不具備可比性。京東的自營和淘寶賣家,一個是京東自己賣,一個是所有人都來賣。就像單純地對比癌癥的發(fā)病率高于心臟病的發(fā)病率,既不能得出癌癥比心臟病更可怕的結(jié)論,也不能說明人們應(yīng)該預(yù)防癌癥多于預(yù)防心臟病。
除此之外,得到每個電商平臺的正品率還算好說,直接合計得出一個總體的正品率,卻沒有道理。不同電商在經(jīng)營模式、消費(fèi)者習(xí)慣等等各個環(huán)節(jié)都有很多差異。在不能確保其他條件相同的情況下,單純的累加只會浪費(fèi)人們的注意力。舉個例子,男性也會得乳腺癌,但遠(yuǎn)比女性低,非要計算全人類得乳腺癌的概率其實沒什么意義。
另一方面,工商總局發(fā)布的監(jiān)測情況表遍布統(tǒng)計陷阱,比如化肥這一類別的質(zhì)量檢測,去除這一項,淘寶的正品率一下從37.25%飛升到44.44%,但是淘寶上的化肥商品恐怕很難占到總量的7%。更不要說其他電商平臺均未抽取化肥這一商品了。
再比如,讓我們粗略地用京東PK天貓一次。按照工商總局發(fā)布的監(jiān)測情況表,京東抽取20個樣本,正品量18,正品率90.00%;天貓抽取7個樣本,正品量6,正品率85.71%。近5%的差別還算明顯。但是按照這個比率,如果天貓抽取21個樣本,正品量是18。這個時候,你還會覺得京東相比天貓有明顯的正品優(yōu)勢嗎?
最少抽取多少個樣本,才算樣本充分?
是的,樣本量的不一致,帶來了很多誤解和不準(zhǔn)確。抽取1個樣本全是假的或者3個樣本全是正品,就推斷該平臺正品率0% 或者 100% 實在過于魯莽。
那么,抽樣調(diào)查中需要多少樣本才算證據(jù)充分呢?實際上,統(tǒng)計學(xué)里,具備相應(yīng)置信度的樣本量是可以計算的。
抽樣方法本身就會引起誤差。在總體中隨機(jī)抽取樣本,樣本均值x是總體均值μ的偏差就是抽樣誤差(E=μ-x)。這個誤差的分布是符合標(biāo)準(zhǔn)正態(tài)分布的。
面對一個數(shù)量龐大的總體,樣本量也要足夠多(>30)時,可以用如下公式可以估算吃需要抽取的樣本量[2]:
n: 樣本量
:方差,抽樣個體值和整體均值之間的偏離程度,抽樣數(shù)值分布越分散方差越大,需要的采樣量越多
E: 為抽樣誤差(可以根據(jù)均值的百分比設(shè)定)
:置信度,置信度越高需要的樣本量越多;95%置信度比90%置信度需要的采樣量多40%;
由此可見,在保證一定置信度(樣本某測量值的可信程度)的情況下,如果要將誤差控制得越小,所需的樣本量則越大。樣本量太少,誤差便會很大,對總體真實情況的推斷和估計也就很難準(zhǔn)確了。
可靠的結(jié)論是要花大錢的
話說回來,你當(dāng)然不能說這次抽檢沒有意義,它至少說明網(wǎng)購有風(fēng)險。畢竟即便只有一件不符合國家規(guī)定的商品也是有問題的,一旦發(fā)現(xiàn)就應(yīng)當(dāng)處理。
但如果要說這樣的抽檢結(jié)果,可以反映網(wǎng)購平臺的整體狀況,還相去甚遠(yuǎn)。如果成本投入少,人力物力時間也不充分,不管是在科學(xué)、社會還是經(jīng)濟(jì)領(lǐng)域,想得到一個可靠的結(jié)論都不太現(xiàn)實。畢竟大型的調(diào)研并非三兩個人一朝一夕能完成,這需要大把的金錢和時間。實際上,國家對于計數(shù)抽樣檢驗有一套復(fù)雜而嚴(yán)密的標(biāo)準(zhǔn)化流程,即 GB2828 和 GB2829 (感謝@軍令部總長q1232123 指教)。
這并非是說普通人不要去嘗試此類調(diào)查研究,而是說條件有限的情況下,想得到一個相對可靠的研究結(jié)果,完善調(diào)查方法尤為重要。這一點,則是人人都可以去努力和實現(xiàn)的。
來源:第三方檢測頻道