在工程設計/開發(fā)中,一個常見的問題是如何確定設計已經(jīng)實現(xiàn)了真正的改進,以便我們判斷是否仍然需要改進某些設計特征參數(shù)。
例如,在開發(fā)的早期,工程師只有約8個部件來執(zhí)行可靠性測試。很快,可靠性測試產生了失效,工程師得出了可靠性水平太低的結論。在設計變更后,工程師再次進行了相同的可靠性測試,假設這次有10個部件,失效時間似乎比上一代設計更長,那么工程師該如何知道所觀察到的改進是真正的改進,而不是偶然的測試結果?
為了幫助工程師,我們可以采用在可靠性工程中的一種方法,就是比較兩種設計的B10壽命,以查看設計2 (D2)是否優(yōu)于設計1 (D1)。D2可能只是D1做了些修改,D2也可能是采用與D1完全不同的技術,當然這個前提是部件的使用壽命能夠滿足性能的要求。請注意,B10壽命是指10%的總體(population) 失效時所對應的壽命(例如,工作小時數(shù)或周期),也就是說,90%的總體會存活超過B10壽命, 或者說可靠性在B10壽命時為90%。
本文將討論使用B10壽命的近似方法來比較兩種設計。我們將用一個示例來說明該方法的步驟。
圖1有兩條威布爾(Weibull) 曲線(每條都有90%的雙側置信曲線),顯示了兩個設計D1和D2的失效分布。
圖1
圖1由隨機數(shù)據(jù)生成(我們使用eWeibull),其中:
設計1 (D1)的β(形狀參數(shù), shape parameter) = 2, η
(尺度參數(shù), scale parameter)= 900小時。
設計2 (D2)的β =3.5, η =1300小時。
兩組的樣本量均為n = 30。
我們需要一個“驗收標準”來確定結果是否足夠好,而不是由偶然因素所造成的。我們可以將驗收標準設定為:“在最小為90%的置信度下,D2設計的B10壽命比D1設計的B10壽命更長/更好。”
但是請注意,當我們做樣本測試時,我們得到的都是樣本統(tǒng)計量。樣本統(tǒng)計存在抽樣誤差
(sampling error),圖1的擬合曲線兩側的邊線就是威布爾擬合分布90%的置信區(qū)間。如果你想估計某一時間的可靠性,那么對于這個可靠性的變異(或者說置信區(qū)間分布)是顯現(xiàn)在y軸上的。同樣,如果你想要在某個累積失效概率上估計一個百分位數(shù)
(percentile),那么這個百分位數(shù)的變異(或者說置信區(qū)間分布)是顯現(xiàn)在x軸上的。
圖2顯示了一條紅色的標記線,代表y軸上的10%(也就是10% 的累積失效概率)。我們可以看到D1設計的B10壽命置信區(qū)間分布(紅色)和D2設計的B10壽命置信區(qū)間分布(藍色)。
圖2
在圖2的示例中,我們有以下來自eWeibull軟件的估計值(這些是極大似然方法估計值(MLE))。具體含義見圖3。
D1設計(我們用X來表示):
β = 2.579
η= 844.24小時
B10,x = 352.8小時(這是x或D1設計的B10壽命)
Lx為B10,x的置信下限, = 254.5小時
Ux為B10,x的置信上限, = 489.1小時
D2設計(我們用Y來表示):
β = 3.409
η=1324.47小時
B10,y = 684.5小時(這是y或D2設計的B10壽命)
Ly為B10,y的置信下限, = 531.4小時
Uy為B10,y的置信上限, = 881.7小時
圖3
這些置信上下限是90%的雙側置信區(qū)間。它們可以直接從威布爾圖中讀取,也可以從eWeibull軟件中獲得.
B10壽命是一個從樣本推算出來的統(tǒng)計值,它的分布其實并不遵循典型的正態(tài)分布 (normal distribution)。
為了簡化理論的推導,作者進行的模擬研究(simulation study)顯示B10壽命趨向于服從對數(shù)正態(tài)(lognormal)分布。一般來說,對于對數(shù)正態(tài)分布的隨機變量W進行轉化(V=ln(W)),,那么該隨機變量的對數(shù)值V將遵循均值(mean,μ )和標準差(standard deviation,σ )的正態(tài)分布。
因此,我們可以用“
”的距離來估計
標準差。在90%雙側置信水平上:
因此
推到出
同理,
混合標準差(pooled standard deviation)為
我們現(xiàn)在可以根據(jù)應力-強度干涉理論(stress-strength interference theory)計算z值:
作者的模擬研究顯示了三個有趣的結果:
MLE程序所產生的B10,x的均值和B10,y的均值會高估(over-estimate)真實值。在我們?yōu)閳D1生成隨機值時,D1和D2的真實B10壽命可以由
中得到,而η和β已在前面的章節(jié)中給出。
模擬研究運行了200次,我們用兩個ln(B10)壽命的距離除以3.92來估算ln(B10)的標準差。這個ln(B10)的標準差通常會被低估(under-estimate).
當在z公式中的分子估計過高,而分母估計過低的情況下,通過模擬研究,計算得到的z值高估了約7.66%。因此,我們建議將z值調整為“調整后的
z’=z*(1/1.0766)=z*(0.93)。
因為我們計算的z = 3.1428,所以“調整后的z’= 3.1428*0.93 = 2.923。因此,相關的置信水平(可以使用excel表格)用公式進行計算如下:NORM.S.DIST(2.923,TRUE)= 0.998 ~ 99.8%置信度。
我們可得到以下兩點結論:
從D1到D2經(jīng)過設計改進, D2設計的B10壽命比D1設計的B10壽命來的大,而且置信度為99.8%。改進時長的點估計(point estimate)約為331小時(= 684.5 - 352.8)。
如果“驗收標準”的要求是“最小為90%的置信度”,那么我們就滿足要求了。
如果我們想要的是顯示改進的壽命增加值(比如,A)為150小時,我們可以這樣做來求置信度:
我們需要將ln(B10)的估計標準差轉換回(B10)的標準差。利用對數(shù)正態(tài)分布的性質,

對于D1設計,我們有
對于D2設計,我們有
混合標準差為
那么我們可以應用以下公式計算z值:
因此置信水平為NORM.S.DIST(1.685,TRUE)= 0.95.4 ~ 95.4%.
本質上,我們是在說:
從D1到D2的設計變化,我們有95.4%的信心認為B10壽命改善后的增加值約150小時。
請注意,我們在這里使用的示例是針對n=30的樣本量。通常,由于資源和業(yè)務運行的限制,我們的樣本量要小得多。為了顯示樣本量的影響,我們將在樣本量為30、20、10、8和6時做了下面的兩個表。我們隨機為每個樣本量生成兩組數(shù)據(jù)(一組用于D1, β=2, η=900,另一組用于D2, β=3.5, η=1300)。然后,我們通過上面所示的步驟來估計以下表中的所有值。
由于樣本量的不同,我們可以看到β和η值的抽樣變化。我們還可以看到,通常樣本量越小,調整后的z值越小,導致置信度越低。
圖4顯示了樣本量n=30和n=20時的視覺對比。我們觀察到,當n=20時,兩條威布爾置信曲線在10%累積失效概率水平線開始重疊。
在圖5中,當樣本量下降到10、8或6時,重疊變得更加嚴重。這是可以解釋的,因為樣本量越小,置信區(qū)間就越寬,尤其是在極低的失效概率情況下。
圖4
圖5