能力驗證是指通過對實驗室檢測結(jié)果進行對比分析,來對實驗室的能力進行系統(tǒng)評價的一項活動。依據(jù)CNAS-RL02:2018《能力驗證規(guī)則》的要求,申請國家認可委(CNAS)認可的實驗室在申請的每個子領(lǐng)域均應(yīng)參加能力驗證活動并證明其技術(shù)能力;獲準認可的實驗室也要按一定頻次定期參加能力驗證活動。
上海材料研究所機械工業(yè)無損檢測中心(SRIMNDT)是國家認可委認定的NDT能力驗證提供者(注冊號:PT 0052),按照ISO/IEC 17043《合格評定 能力驗證的通用要求》開展無損檢測領(lǐng)域的能力驗證活動。無損檢測能力驗證涉及到磁粉檢測、超聲檢測、射線檢測和滲透檢測等領(lǐng)域。
無損檢測能力驗證的數(shù)據(jù)統(tǒng)計和結(jié)果分析對于能力驗證計劃的合理設(shè)計、有效分析、客觀評價和結(jié)果利用都具有重要作用。本文以2018年和2019年兩個年度的磁粉檢測能力驗證結(jié)果為例,探討了不同統(tǒng)計方法對能力驗證結(jié)果分析的影響。
一、磁粉檢測能力驗證結(jié)果評價現(xiàn)狀
目前,主要采用偏倚估計值法和數(shù)理統(tǒng)計兩種方法對磁粉檢測能力驗證結(jié)果進行評價。偏倚值估計法是將考核樣品定值實驗得出的參考值作為指定值X,將能力驗證參加者的檢測結(jié)果x與指定值X的差值與最大允許誤差或參考值的不確定度進行比較。數(shù)理統(tǒng)計則是通過對參加同一批能力驗證的檢測結(jié)果進行統(tǒng)計分析,來確定指定值X和能力驗證評定標準差圖片,并進行合格判定。常用的能力驗證統(tǒng)計方法主要分為異常數(shù)據(jù)檢驗法和穩(wěn)健統(tǒng)計法。
異常數(shù)據(jù)檢驗法主要是基于格拉布斯(Grubbs)等準則的經(jīng)典統(tǒng)計法,其特點是在給定的顯著性水平下,通過概率統(tǒng)計的原理發(fā)現(xiàn)并剔除異常值。由于其顯著性水平是人為給定的,所以準確性也會受到人為因素影響。
穩(wěn)健統(tǒng)計法是指不用識別或剔除離群值,可使用所有測量數(shù)據(jù)將離群值的作用降低的統(tǒng)計分析方法。目前標準中推薦的穩(wěn)健統(tǒng)計法主要是中位值和標準化四分位距法和迭代法。相較于異常數(shù)據(jù)檢驗法,穩(wěn)健統(tǒng)計法的優(yōu)點是異常值的判定不受人為因素影響,當(dāng)檢測數(shù)據(jù)符合或者較符合正態(tài)分布時,都可以得到較為可靠的分析結(jié)果,但當(dāng)數(shù)據(jù)明顯偏離正態(tài)分布時,穩(wěn)健統(tǒng)計法不是最優(yōu)的選擇。有研究者在對醫(yī)學(xué)檢驗實驗室能力驗證結(jié)果評價中發(fā)現(xiàn),當(dāng)能力驗證檢測數(shù)據(jù)較多時,穩(wěn)健統(tǒng)計法比異常數(shù)據(jù)檢驗法更為嚴格。
磁粉檢測是一種常規(guī)的無損檢測技術(shù),是鐵磁性材料表面缺陷檢測的首選方法。其以磁粉作為顯示介質(zhì),對鐵磁性材料工件的缺陷進行觀察,具有操作簡便、成本低廉、檢測靈敏度高等優(yōu)點。但是這種方法對檢測人員的經(jīng)驗水平要求較高,若在磁化過程控制、磁懸液使用、磁粉觀察等過程中操作不當(dāng),檢測結(jié)果都會產(chǎn)生較大偏差。
由于磁粉檢測結(jié)果受人為因素影響較大,統(tǒng)計的檢測數(shù)據(jù)不易滿足正態(tài)分布,不同的統(tǒng)計方法對分析結(jié)果的影響較大。文中使用了異常數(shù)據(jù)檢驗法中的格拉布斯統(tǒng)計法,中位值和標準化四分位距法和迭代法,對磁粉檢測能力驗證結(jié)果進行分析比較,探索適用于不同情況下的數(shù)據(jù)統(tǒng)計方法。
二、數(shù)據(jù)統(tǒng)計方法介紹
1、Z比分數(shù)
Z比分數(shù)是判定能力驗證檢測結(jié)果的主要依據(jù)。Z比分數(shù)是由參加者的結(jié)果x、能力驗證的指定值X和能力驗證評定標準差圖片得到的實驗室偏倚的標準化度量。文中的3種統(tǒng)計方法中,指定值X是由參加者結(jié)果統(tǒng)計得到的平均值、中位值或穩(wěn)健平均值;標準差圖片代表了穩(wěn)健標準差、標準化四分位距或傳統(tǒng)標準差。Z比分數(shù)計算公式為:
當(dāng)|Z|≤2時,表明結(jié)果滿意;當(dāng)2<|Z|<3時,表明結(jié)果有問題;當(dāng)|Z|≥3時,表明結(jié)果不滿意。
2、格拉布斯統(tǒng)計法
格拉布斯統(tǒng)計法是基于格拉布斯準則的一種經(jīng)典統(tǒng)計法。格拉布斯準則是以正態(tài)分布為前提,在應(yīng)用前需要驗證數(shù)據(jù)是否基本符合正態(tài)分布,并且需要確認統(tǒng)計的檢出水平α和剔除水平α*。依據(jù)一組數(shù)據(jù)的α和α*以及數(shù)據(jù)個數(shù)n,通過查閱格拉布斯檢驗臨界值表獲得臨界值G1-α(n)(單側(cè)情形)或G1-α/2(n)(雙側(cè)情形)。
在計算得到該組檢測數(shù)據(jù)的初始平均值和標準差后,通過檢測數(shù)據(jù)的最大值或最小值計算統(tǒng)計量Gn值,當(dāng)統(tǒng)計量Gn值大于檢出水平α對應(yīng)的臨界值時,再將該值與剔除水平α*對應(yīng)的臨界值比較,如果超限則作為統(tǒng)計離群值剔除,并重新計算數(shù)組平均值和標準差,按照以上步驟進行重復(fù)判定,直至沒有出現(xiàn)新的統(tǒng)計離群值。在格拉布斯統(tǒng)計法中,最終以去掉統(tǒng)計離群值后的平均值和標準差作為指定值和能力評定標準差。
常見的檢出水平α和剔除水平α*為0.005~0.1,數(shù)值越大代表了檢出和剔除要求越嚴格。文中選定的檢出水平α和剔除水平α*分別為0.1和0.05,即超出95%范圍的數(shù)值被認定為統(tǒng)計離群值,以有效排除磁粉檢測中人為因素造成的異常檢測結(jié)果對統(tǒng)計結(jié)果的影響。
格拉布斯統(tǒng)計法的優(yōu)點是對離群值的定位十分有效,其適用于離群值較少的情形,但在檢測數(shù)據(jù)過于分散,產(chǎn)生較多離群值的情況下,該方法則不適用。
3、中位值和標準化四分位距法
中位值和標準化四分位距法是目前能力驗證機構(gòu)廣泛使用的一種穩(wěn)健統(tǒng)計法,其采用數(shù)據(jù)中位值作為指定值,并計算標準化四分位距作為能力評定標準差。通過計算上四分位值與下四分位值之間的差值得到四分位距,并乘以因子0.7413得到標準化四分位距。
該統(tǒng)計方法的特點是將前25%數(shù)據(jù)和后25%數(shù)據(jù)的影響降低,主要使用中間段50%數(shù)據(jù),其應(yīng)用前提同樣是正態(tài)分布,但現(xiàn)實中大多數(shù)數(shù)據(jù)并不能嚴格滿足要求,如果中間段50%數(shù)據(jù)過于集中,容易導(dǎo)致得到的能力評定標準差偏小,產(chǎn)生第一類錯誤(棄真)。如果數(shù)據(jù)所有異常值出現(xiàn)在同一側(cè),或者產(chǎn)生“雙峰”現(xiàn)象,則統(tǒng)計模型失效,甚至產(chǎn)生第二類錯誤(取偽)。
4、迭代法
迭代法也是一種穩(wěn)健統(tǒng)計法,其原理是將檢測數(shù)據(jù)按照升序排列后,以中位值作為參照值,距離較遠的數(shù)值分配較小的權(quán)重,距離較近的數(shù)值分配較大的權(quán)重,并計算得到穩(wěn)健平均值x*和穩(wěn)健標準差s*。迭代法不但可以最大程度減小離群值的影響,還可以降低可疑值的作用。相較于中位值和標準化四分位距法,迭代法可以應(yīng)用在一些非正態(tài)分布的數(shù)據(jù)中,并得到相對準確的統(tǒng)計結(jié)果。但對于分布嚴重不對稱、雙峰分布或大比例數(shù)據(jù)相同的數(shù)據(jù)模型,迭代法也可能會失效。
5、其他方法
除了本文使用的3種方法,還有一些其他統(tǒng)計方法也常用于能力驗證的結(jié)果分析中。在經(jīng)典統(tǒng)計法中,還有狄克遜(Dixon)統(tǒng)計法、奈爾(Nair)統(tǒng)計法等,可用來確定并排除離群值。在穩(wěn)健統(tǒng)計法中,CNAS GL002:2018《能力驗證結(jié)果的統(tǒng)計處理和能力評價指南》還推薦了算法S,用于計算標準差(或極差),并可推出標準差或極差的穩(wěn)健聯(lián)合值。
三、數(shù)據(jù)來源
數(shù)據(jù)取自筆者所在單位在2018年和2019年組織的鋼焊縫磁粉檢測能力驗證活動(參與的實驗室分別為21家和24家),所有實驗室所檢均為同一鋼焊縫樣品。
能力驗證樣品采用普通碳素鋼焊接而成,焊接方法為二氧化碳氣體保護焊,焊接形式為對接焊縫,焊縫表面有焊接形成的缺陷。檢測方法為傳統(tǒng)的磁軛法,并采用相關(guān)焊縫磁粉檢測標準進行檢測。標準試樣中有兩處缺陷,參加能力驗證的實驗室需要分別對缺陷的顯示位置(X1,X2)和長度(L1,L2)進行檢測。
四、結(jié)果與討論
采用未剔除離群值的經(jīng)典統(tǒng)計法作為參照,使用格拉布斯統(tǒng)計法、中位值和標準化四分位距法和迭代法對2018年和2019年鋼焊縫磁粉檢測能力驗證檢測結(jié)果進行統(tǒng)計,結(jié)果如表1和表2所示。2018年和2019年的統(tǒng)計數(shù)量分別為21個和24個,分別對4個分項檢測指標(X1,L1,X2,L2)進行統(tǒng)計。
表1 2018年鋼焊縫磁粉檢測統(tǒng)計結(jié)果
表2 2019年鋼焊縫磁粉檢測統(tǒng)計結(jié)果
1、指定值準確性分析
使用的格拉布斯統(tǒng)計法剔除水平α*為0.05。在使用格拉布斯統(tǒng)計法對4組位置數(shù)據(jù)進行統(tǒng)計時,發(fā)現(xiàn)并剔除了離群值后,4組數(shù)據(jù)的指定值相較于經(jīng)典統(tǒng)計法的結(jié)果發(fā)生了偏移,同時能力驗證評定標準差減小,對于可疑值的評定更加嚴格。另外4組沒有出現(xiàn)離群值的數(shù)據(jù),其得到的指定值和能力驗證評定標準差與經(jīng)典統(tǒng)計法得到的結(jié)果相同。
應(yīng)用中位值和標準化四分位距法和迭代法這兩種穩(wěn)健統(tǒng)計法進行統(tǒng)計后,8組數(shù)據(jù)的指定值相較于經(jīng)典統(tǒng)計法均發(fā)生了偏移,而能力驗證評定標準差相應(yīng)減小。在4組剔除異常結(jié)果的數(shù)據(jù)中,將兩種穩(wěn)健統(tǒng)計法與格拉布斯統(tǒng)計法的結(jié)果進行對比發(fā)現(xiàn),迭代法與格拉布斯統(tǒng)計法的指定值更接近,相對于經(jīng)典統(tǒng)計法結(jié)果均發(fā)生了同方向的偏移;中位值和標準化四分位距法的指定值未發(fā)生偏移,而2019-X1(表示2019年的數(shù)據(jù)L1,其余類比)指定值的偏移方向與格拉布斯統(tǒng)計法的相反,其余兩組的偏移方向與格拉布斯統(tǒng)計法的相同。經(jīng)過比較,在出現(xiàn)較為明顯的異常結(jié)果時,迭代法得到的指定值準確性更高。
2、嚴格程度合理性分析
為了進一步比較格拉布斯統(tǒng)計法、中位值和標準化四分位距法和迭代法在能力驗證結(jié)果分析中的適用性,筆者分析3種方法得到的數(shù)據(jù)滿意率,結(jié)果如表3(NIOR為四分位距)和表4所示。
表3 2018年不同統(tǒng)計方法的滿意率分析結(jié)果
表4 2019年不同統(tǒng)計方法的滿意率分析結(jié)果
在格拉布斯統(tǒng)計法發(fā)現(xiàn)離群值的4組數(shù)據(jù)中,2018-X1,2018-X2和2019-X1基本符合正態(tài)分布,使用3種不同統(tǒng)計方法評定的滿意率相同,且體現(xiàn)統(tǒng)計方法嚴格程度的能力驗證評定標準差也基本相同;而對于2019-X2,其中位值和標準化四分位距法和迭代法得到的滿意率和能力驗證評定標準差與格拉布斯統(tǒng)計法的有較大差異。經(jīng)過對該組數(shù)據(jù)進行分析,發(fā)現(xiàn)數(shù)據(jù)中有大比例相同的數(shù)據(jù),數(shù)據(jù)整體不符合正態(tài)分布,導(dǎo)致了中位值和標準化四分位距法和迭代法分析的結(jié)果失真,所剔除的部分離群值為誤判,而采用剔除水平α*為0.05的格拉布斯統(tǒng)計法,得到的判定結(jié)果更符合實際情況。
格拉布斯統(tǒng)計法未發(fā)現(xiàn)離群值的4組數(shù)據(jù)(2018-L1,2018-L2,2019-L1和2019-L2)基本符合正態(tài)分布。將中位值和標準化四分位距法和迭代法的統(tǒng)計結(jié)果進行比較,發(fā)現(xiàn)在2018-L1中,迭代法的嚴格程度高于中位值和標準化四分位距法的,而另外3組嚴格程度基本相同。
結(jié)語
(1) 在磁粉檢測能力驗證結(jié)果分析中,當(dāng)數(shù)據(jù)模型符合或基本符合正態(tài)分布模型時,迭代法、中位值和標準化四分位距法可以排除統(tǒng)計過程中人為因素對結(jié)果的影響;迭代法得到的指定值比中位值和標準化四分位距法的更為準確可靠;迭代法的嚴格程度也略高于后者。當(dāng)數(shù)據(jù)模型不符合正態(tài)分布模型時,中位值和標準化四分位距法與迭代法容易失效,并可能產(chǎn)生誤判,而選用剔除水平α*為0.05的格拉布斯統(tǒng)計法可以得到更合理的統(tǒng)計結(jié)果。
(2) 應(yīng)依據(jù)數(shù)據(jù)分布特征合理選擇數(shù)據(jù)統(tǒng)計方法對磁粉檢測能力驗證結(jié)果進行分析,以提高分析結(jié)果的可信度。當(dāng)數(shù)據(jù)滿足或基本滿足正態(tài)分布時,建議采用迭代法進行結(jié)果分析;當(dāng)數(shù)據(jù)不滿足正態(tài)分布時,建議采用格拉布斯統(tǒng)計法,結(jié)合檢測數(shù)據(jù)數(shù)量、數(shù)據(jù)分布特征等因素,合理選擇剔除水平α*,剔除人為誤差造成的異常結(jié)果。
