您當(dāng)前的位置:檢測資訊 > 實驗管理
嘉峪檢測網(wǎng) 2025-03-18 20:54
為啥要做顯著性分析?
簡單來說,當(dāng)我們做實驗得到一堆數(shù)據(jù)后,得知道這些數(shù)據(jù)里呈現(xiàn)出的差異到底是真的有意義,還是只是偶然出現(xiàn)的波動。顯著性分析就像是一個“數(shù)據(jù)裁判”,能幫我們判斷不同組數(shù)據(jù)之間的差異是不是靠譜,讓我們的研究結(jié)論更有說服力。比如說,研究某種藥物對病癥的治療效果,通過顯著性分析,我們才能確定觀察到的病情改善是不是因為藥物起作用,而不是隨機因素導(dǎo)致的。
常用的顯著性分析方法
T 檢驗
• 適用場景:主要用于兩組數(shù)據(jù)的比較,像是比較實驗組和對照組的某個指標均值是否存在顯著差異。比如對比對照組和實驗處理組來明確處理是否有效果。
• 實現(xiàn)方式:在 R 語言中,使用t.test()函數(shù)就能輕松搞定。兩組數(shù)據(jù)group1和group2,代碼:t.test(group1, group2),運行后就能得到 t 值、p 值等關(guān)鍵結(jié)果。
方差分析(ANOVA)
• 適用場景:當(dāng)我們要比較三組及以上數(shù)據(jù)的均值差異時,方差分析就派上用場了。例如研究不同肥料對農(nóng)作物產(chǎn)量的影響,有多種肥料類型的實驗組和一個對照組。
• 實現(xiàn)方式:R 語言里的aov()函數(shù)是常用工具。三組數(shù)據(jù)groupA、groupB、groupC,代碼為aov_result <- aov(response_variable ~ group_variable, data = your_data_frame),其中response_variable是要分析的因變量(如農(nóng)作物產(chǎn)量),group_variable是自變量(如肥料類型),然后通過summary(aov_result)查看分析結(jié)果。
卡方檢驗
• 適用場景:常用于分析分類數(shù)據(jù)的關(guān)聯(lián)性和獨立性。比如調(diào)查不同性別對某種產(chǎn)品的偏好是否存在顯著差異,性別和產(chǎn)品偏好就是兩個分類變量。
• 實現(xiàn)方式:在 R 中,chisq.test()函數(shù)。chisq.test(contingency_table)就能給出卡方值、自由度和 p 值等結(jié)果,讓我們判斷分類變量之間的關(guān)系是否顯著。
結(jié)果解讀
當(dāng)?shù)玫斤@著性分析的結(jié)果,重點關(guān)注 p 值哦。一般來說,如果 p 值小于設(shè)定的顯著性水平(常見的是 0.05),那就意味著數(shù)據(jù)中的差異是顯著的,研究假設(shè)可能是成立的;反之,如果 p 值大于 0.05,就說明差異可能不顯著,要謹慎下結(jié)論,也需要進一步優(yōu)化實驗或者分析方法。
注意事項
• 數(shù)據(jù)獨立性:確保數(shù)據(jù)集中的每個觀測值都是獨立的,不然會嚴重影響分析結(jié)果的準確性。比如在抽樣調(diào)查時,不能有重復(fù)抽樣或者關(guān)聯(lián)性抽樣的情況。
• 樣本量合理性:樣本量過小可能導(dǎo)致檢測不出真實存在的差異,而樣本量過大可能會把微小的、無實際意義的差異也檢測出來。所以要根據(jù)研究目的和總體情況,合理確定樣本量。
• 數(shù)據(jù)分布假設(shè):像 t 檢驗和方差分析通常要求數(shù)據(jù)滿足正態(tài)分布等假設(shè)條件,如果數(shù)據(jù)不滿足,可能需要先進行數(shù)據(jù)轉(zhuǎn)換(如對數(shù)轉(zhuǎn)換)或者選擇非參數(shù)檢驗方法,不然結(jié)果可能不準確哦。
如何進行顯著性差異abcd字母標注法?
一、顯著性分析
通常顯著性分析后三種標注差異結(jié)果的方式:1,用*標注;2,直接用P值標注;3,或用abcd標注。
第一種和第二種一般適應(yīng)于組別較少的。
第三種組別多是,用abcd比較,又稱多重比較。
多重比較和兩兩比較是不一樣的。不能簡單理解為多重比較就是包含多個兩兩比較而已。因為(1)誤差由多個處理內(nèi)的變異合并估計,自由度增大了,因而比較的精確度也增大了;(2)由于F測驗顯著,證實處理間總體上有真實差異后再做的兩兩平均數(shù)的比較,不大會想單獨比較是那樣蔣個別偶然性的誤差誤判為真實誤差。
二、abcd標注步驟
首先將全部平均數(shù)從大到小依次排列,然后在最大的平均數(shù)上標上字母a;
并將該平均數(shù)與以下各平均數(shù)相比,凡相差不顯著的,都標上字母a,直至某一個與之相差顯著的平均數(shù),標記字母b;
再以該標有b的該平均數(shù)為標準,與上方各個比它大的平均數(shù)比較,凡不顯著的也一律標以字母b;再以標有b的最大平均數(shù)為標準,與以下各未標記的平均數(shù)比,凡不顯著的繼續(xù)標以字母b,直至遇到某一個與其差異顯著的平均數(shù)標記c。
凡有一個相同標記字母的即為差異不顯著,凡具不同標記字母的即為差異顯著.
小寫字母表示顯著水平α = 0.05;大寫字母表示顯著水平α = 0.01
舉個栗子:如何使用prism計算顯著性并標注字母

四個藥劑對病害真菌的抑制率比較
1,首先是輸入數(shù)據(jù),然后點擊graphs生稱圖片

2,在result選擇中,選擇單因素方差分析

點擊ok后設(shè)置下比對參數(shù)


這里我們選擇是新復(fù)極差法。

然后根據(jù)結(jié)果在圖中標注顯著性差異字母。

三、多重比較的方法
多重比較一般含有三種方法:最小顯著差數(shù)法,q檢驗和新復(fù)極差法。
LSD法(最小顯著差數(shù)法):適用于一對或幾對在專業(yè)上有特殊意義的樣本均數(shù)間的比較。LSD法是最簡單的比較方法之一,它實際上只是t檢驗的一種簡單變形,未對檢驗水準做任何校正,只是在標準誤的計算上充分利用了樣本信息。
q檢驗:適用于多個樣本均數(shù)兩兩之間的全面比較。SNK-q檢驗是一種基于預(yù)先指定的準則將各組均值分為多個亞組,利用Studentized Range分布進行假設(shè)檢驗的方法,并根據(jù)所要檢驗的均值個數(shù)調(diào)整總的“棄真”錯誤概率不超過設(shè)定的顯著性水平a。
新復(fù)極差法:全稱為Tukey's Honestly Significant Difference法。應(yīng)用這種方法要求各組樣本含量相同。Tukey法也是利用Studentized Range分布來進行各組均數(shù)間的比較,與SNK法不同的是,它控制所有比較中最大的“棄真”錯誤概率不超過設(shè)定的顯著性水平a。
選擇依據(jù):
如果否認正確的(即犯α錯誤)是事關(guān)重大或后果嚴重的,應(yīng)用q檢驗;這是寧愿使犯β錯誤的風(fēng)險較大而不使犯α錯誤有較大風(fēng)險的情況。
如果承受不正確的(即β錯誤)是事關(guān)重大或后果嚴重的,那么易采用PLSD(LSD的另一種形式)或SSR(最小顯著極差法)測驗,這是寧愿冒較大的α錯誤的風(fēng)險,而不愿冒較大的β錯誤的風(fēng)險的情況。
在一般的農(nóng)業(yè)試驗研究中,較為廣泛應(yīng)用的是PLSD測驗法和SSR測驗法。

來源:iRice 科研君