中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

您當(dāng)前的位置:檢測(cè)資訊 > 法規(guī)標(biāo)準(zhǔn)

藥物臨床研究中多個(gè)臨床終點(diǎn)的指導(dǎo)原則

嘉峪檢測(cè)網(wǎng)        2022-10-26 06:19

1、介紹

 

在人用藥品和生物制品的臨床研究中,可能會(huì)采用多終點(diǎn)的方法對(duì)研究結(jié)果進(jìn)行分析和解釋。本指導(dǎo)原則為申辦方和審評(píng)人員提供了FDA針對(duì)多終點(diǎn)相關(guān)的問題的觀點(diǎn),以及如何在臨床研究中處理這些問題。在藥物研發(fā)過程中開展的臨床研究,多數(shù)的臨床研究都包含了多個(gè)終點(diǎn)。這些終點(diǎn)用來評(píng)估藥品產(chǎn)生的影響,并記錄藥物對(duì)一種或多種疾病特征產(chǎn)生有利影響的能力。但在研究中進(jìn)行多終點(diǎn)分析的時(shí)候,如果沒有對(duì)多重性進(jìn)行適當(dāng)?shù)恼{(diào)整,得到關(guān)于療效的錯(cuò)誤結(jié)論的可能性就會(huì)增加。所以,應(yīng)該采取適當(dāng)?shù)拇胧?duì)多重性進(jìn)行調(diào)整。

 

本指導(dǎo)原則的目的描述為分析藥物效果而對(duì)終點(diǎn)進(jìn)行分組和排序的不同的策略,以及一些公認(rèn)的統(tǒng)計(jì)方法來管理研究中的多重性,從而減少研究中得到關(guān)于療效的錯(cuò)誤結(jié)論的可能性。如果相關(guān)風(fēng)險(xiǎn)沒有得到適當(dāng)?shù)目刂疲敲椿谶@樣的分析得到的結(jié)論也會(huì)導(dǎo)致對(duì)藥品療效的誤判和誤導(dǎo)性陳述。

 

1998年9月頒布的ICH E9《臨床試驗(yàn)統(tǒng)計(jì)原則》(1998年9月)是一個(gè)涉及范圍廣泛的指南,包括對(duì)多終點(diǎn)問題的討論。本指導(dǎo)原則則為多終點(diǎn)的相關(guān)問題提供了更詳細(xì)的解釋。本指導(dǎo)原則的頒布履行了FDA在2007年《食品和藥品管理修正案》(FDAAA)中的承諾。

 

一般來說,F(xiàn)DA的指導(dǎo)原則通常不代表有法律效力的規(guī)定,而是代表了FDA目前對(duì)相關(guān)問題的看法和建議。如果有相關(guān)的法律法規(guī)出臺(tái)則另當(dāng)別論。本原則中提到的“應(yīng)當(dāng)”是說FDA建議這樣做,但不等于說是必須這樣做。

 

2、背景和范圍

 

在臨床研究中,藥品療效是通過療效終點(diǎn)來體現(xiàn)的。療效終點(diǎn)包括臨床事件(例如,死亡率、中風(fēng)、呼吸衰竭、靜脈栓塞)、癥狀(例如:疼痛、呼吸困難、抑郁癥狀)、功能測(cè)量(例如:行走和運(yùn)動(dòng)能力)或有望預(yù)測(cè)臨床獲益的替代終點(diǎn)。

 

因?yàn)榇蠖鄶?shù)的疾病會(huì)導(dǎo)致多種臨床事件、癥狀和/或功能改變,很多臨床研究的設(shè)計(jì)是針對(duì)疾病的多個(gè)方面。在某些情況下,僅針對(duì)疾病的某個(gè)方面進(jìn)行療效評(píng)估是不合適的,需要將疾病的多個(gè)方面合并為一個(gè)終點(diǎn)或者進(jìn)行多終點(diǎn)的評(píng)估。也存在另外一種情況,那就是對(duì)多終點(diǎn)中的任何一個(gè)終點(diǎn)進(jìn)行評(píng)估就足以支持該產(chǎn)品的上市批準(zhǔn)。

 

在采用多終點(diǎn)的臨床研究中,如果對(duì)多重性沒有進(jìn)行良好的處理,就會(huì)增加得出錯(cuò)誤的療效結(jié)論的可能性。監(jiān)管部門對(duì)多重性的關(guān)注主要出現(xiàn)在對(duì)臨床試驗(yàn)的評(píng)估中,這些試驗(yàn)旨在證明支持藥物批準(zhǔn)和FDA批準(zhǔn)的標(biāo)簽中的聲明的有效性。但是,這個(gè)問題在整個(gè)的藥品研發(fā)過程中都是很重要的。例如,如果通過假設(shè)檢驗(yàn)來評(píng)估安全性的結(jié)果,就需要考慮本指導(dǎo)原則提到的多重性的問題。安全性分析的多重性問題不屬于正式統(tǒng)計(jì)測(cè)試中預(yù)先指定的假設(shè)集的一部分,不是本指導(dǎo)原則中討論的問題。

 

在以下的章節(jié)中,對(duì)多終點(diǎn)問題和對(duì)多終點(diǎn)的處理方法進(jìn)行了討論。多重性問題和對(duì)多終點(diǎn)的處理方法也同樣適用于其他原因產(chǎn)出的多重性,包括估計(jì)目標(biāo)的其他屬性(例如:多劑量、多時(shí)間點(diǎn)、研究人群的亞組);但是,這些其他來源的多重性不是本指導(dǎo)原則討論的內(nèi)容。而且,對(duì)于某些特殊情況下的多重性,可能會(huì)有與多重性有關(guān)的不同的考慮。例如,在主方案中評(píng)估不同的產(chǎn)品對(duì)同一個(gè)疾病的療效,這也不是本指導(dǎo)原則中討論的問題。本指導(dǎo)原則集中于同一臨床研究中對(duì)多終點(diǎn)問題進(jìn)行分析和解釋。

 

體現(xiàn)研究目的:療效

 

如果一項(xiàng)研究提供了客觀的療效證據(jù),呈現(xiàn)出了所期望的藥品療效,這對(duì)于新藥的批準(zhǔn)是至關(guān)重要的(例如,“適當(dāng)和良好控制的研究...基于平等和負(fù)責(zé)的結(jié)論...藥品具有其所聲稱的效用”)(section 505(d) of the FD&C Act)。

 

FDA的法規(guī)進(jìn)一步規(guī)定,藥品的臨床研究必須采取適當(dāng)?shù)姆椒ǎ枰M(jìn)行良好的控制。此外,應(yīng)該“對(duì)對(duì)研究結(jié)果的分析足以評(píng)估藥物的效果”,即“實(shí)施藥品臨床研究的目的,是將藥品產(chǎn)生的效應(yīng)與其他因素區(qū)分開,這些因素包括病程變化、安慰劑影響、觀察中的偏倚等”。

 

在單個(gè)的臨床研究中,在假設(shè)檢驗(yàn)的結(jié)論之外,在評(píng)估療效的客觀證據(jù)的時(shí)候,還有需要考慮一些其他的重要因素(例如:終點(diǎn)和評(píng)估效應(yīng)的臨床相關(guān)性,相關(guān)的外部信息)。在FDA其他的指導(dǎo)原則中,有關(guān)于療效客觀證據(jù)的更廣泛的討論,但這不是本指導(dǎo)原則的討論范圍。

 

通常是通過假設(shè)檢驗(yàn)來解決針對(duì)所選擇的終點(diǎn)進(jìn)行的療效評(píng)估中產(chǎn)生的不確定性問題。這種方法始于對(duì)所選擇的終點(diǎn)進(jìn)行相關(guān)假設(shè)。在最簡(jiǎn)單的情況下,目的是體現(xiàn)試驗(yàn)藥與對(duì)照藥相比的優(yōu)效性。在臨床研究開始前,針對(duì)終點(diǎn)有兩個(gè)互不相容的假設(shè):

 

● 第一個(gè)假設(shè)是無效假設(shè),聲稱針對(duì)所選擇的終點(diǎn)沒有治療效應(yīng)。

 

● 另一個(gè)假設(shè)是備擇假設(shè),假定試驗(yàn)藥物至少有某些治療效應(yīng)。

 

采用預(yù)先確定的統(tǒng)計(jì)方法對(duì)這對(duì)假設(shè)進(jìn)行檢驗(yàn),看無效假設(shè)是否會(huì)被否定,備擇假設(shè)是否會(huì)被認(rèn)可,從而用以確定研究結(jié)果。需要注意的是,如果無效假設(shè)不能被否定,并不意味著無效假設(shè)就是成立的。有很多因素可以導(dǎo)致否定無效假設(shè)失敗,例如樣本量不夠等。

 

在某些情況下(例如在一些疫苗的臨床研究中),在一些研究中需要有最小的治療效應(yīng)來體現(xiàn)療效,這對(duì)于藥品的批準(zhǔn)至關(guān)重要。在這種情況下,如果采用正規(guī)的統(tǒng)計(jì)檢驗(yàn)來體現(xiàn)療效,應(yīng)該對(duì)無效假設(shè)進(jìn)行適當(dāng)?shù)男薷?,將最小的臨床效應(yīng)包含在無效假設(shè)之中。

 

本指導(dǎo)原則的重點(diǎn)在于基于假設(shè)檢驗(yàn)的統(tǒng)計(jì)學(xué)框架。如果申辦方為了特殊的研發(fā)項(xiàng)目,例如兒科項(xiàng)目,需要采用其他的統(tǒng)計(jì)學(xué)方法(例如貝葉斯法),應(yīng)當(dāng)盡早與FDA進(jìn)行討論。

 

I類錯(cuò)誤

 

拒絕無效假設(shè),可以支持得出兩組療效有差異的結(jié)論,但并不等于說無效假設(shè)絕對(duì)是錯(cuò)的。仍然存在錯(cuò)誤地否定無效假設(shè)的可能性,也就是說,事實(shí)上無效假設(shè)是對(duì)的。這種錯(cuò)誤的結(jié)論被稱為是I類錯(cuò)誤。對(duì)于一個(gè)終點(diǎn)來說,錯(cuò)誤地拒絕無效假設(shè)以及針對(duì)這一終點(diǎn)得出有治療效應(yīng)(實(shí)際上是沒有治療效應(yīng)的)的結(jié)論的幾率,被稱為是針對(duì)該終點(diǎn)的I類錯(cuò)誤發(fā)生率或I類錯(cuò)誤率。顯著性水平,記錄為a,是控制I類錯(cuò)誤發(fā)生率的閾值。做出拒絕無效假設(shè)判斷,是基于通過研究結(jié)果計(jì)算出的無效假設(shè)正確的概率(P值)足夠?。ㄍǔJ切∮赼)。

 

備擇假設(shè)可以是單側(cè)的或雙側(cè)的,并以此為基礎(chǔ)進(jìn)行統(tǒng)計(jì)分析。對(duì)雙側(cè)的統(tǒng)計(jì)檢驗(yàn)而言,I類錯(cuò)誤的概率是指在試驗(yàn)組和對(duì)照組的療效實(shí)際上沒有差別的情況下,得出療效有差別結(jié)論的可能性。對(duì)于單側(cè)檢驗(yàn)而言,I類錯(cuò)誤的概率是指在實(shí)際上試驗(yàn)組和對(duì)照組沒有差別的情況下,得出試驗(yàn)組優(yōu)于對(duì)照組結(jié)論的可能性。通常情況下,對(duì)于雙側(cè)檢驗(yàn)而言,該值設(shè)定為0.05;對(duì)于單側(cè)檢驗(yàn)而言,該值設(shè)定為0.025。

 

對(duì)于雙側(cè)檢驗(yàn)而言,0.05的意思是:當(dāng)不存在差異時(shí)(在實(shí)際上兩組療效相同的情況下),錯(cuò)誤地得出試驗(yàn)組與對(duì)照組療效不同的結(jié)論的可能性不超過5%,也就是20分之1,不管是試驗(yàn)組優(yōu)于對(duì)照組還是劣于對(duì)照組。對(duì)于單側(cè)檢驗(yàn)而言,0.025的意思是:在實(shí)際上兩組療效相同的情況下,錯(cuò)誤地得出試驗(yàn)組療效優(yōu)于對(duì)照組的結(jié)論的可能性為2.5%,也就是40分之1。雙側(cè)檢驗(yàn)的0.05涵蓋了對(duì)稱的雙側(cè)的概率,所以也包括了錯(cuò)誤地得出優(yōu)效結(jié)論的2.5%的單側(cè)檢驗(yàn)概率(40分之1)。通過恰當(dāng)?shù)慕y(tǒng)計(jì)檢驗(yàn)可以得到正確的I類錯(cuò)誤的概率。如果統(tǒng)計(jì)檢驗(yàn)有問題(例如,基本的假設(shè)不成立),那么I類錯(cuò)誤的概率會(huì)更大。

 

FDA要求控制I類錯(cuò)誤的概率以減少對(duì)于主要和次要終點(diǎn)得出錯(cuò)誤的優(yōu)效性結(jié)論(見第III章),而不管研究的哪個(gè)或者多少終點(diǎn)沒有效應(yīng)。針對(duì)多終點(diǎn)研究的I類錯(cuò)誤率被稱為總的I類錯(cuò)誤率??刂七@個(gè)概率的原理在后面的章節(jié)描述(第II章C部分)。

 

當(dāng)有多于一個(gè)的主要終點(diǎn)和次要終點(diǎn)的時(shí)候,要保證對(duì)多重假設(shè)的評(píng)估不會(huì)導(dǎo)致研究總的I類錯(cuò)誤的膨脹,以至于高于原來計(jì)劃的水平,這一點(diǎn)很重要。為了控制I類錯(cuò)誤的發(fā)生率,對(duì)于申辦方至關(guān)重要的是,要前瞻性的注明以下內(nèi)容:

 

● 在主要終點(diǎn)和次要終點(diǎn)中所有的終點(diǎn)情況(見第三章,定義)

● 所有針對(duì)預(yù)先定義的、用于進(jìn)行假設(shè)檢驗(yàn)的數(shù)據(jù)分析,不管這些數(shù)據(jù)是用于主要終點(diǎn)或次要終點(diǎn)。

 

對(duì)于多終點(diǎn)的臨床研究而言,統(tǒng)計(jì)分析計(jì)劃要對(duì)相關(guān)假設(shè)的檢驗(yàn)程序進(jìn)行描述,這些假設(shè)要對(duì)I類錯(cuò)誤水平有良好的控制。

 

多重性

 

對(duì)于單終點(diǎn)的、采用雙側(cè)檢驗(yàn)的(α = 0.05)臨床研究而言,如果試驗(yàn)組和對(duì)照組實(shí)際上沒有差別,但得出試驗(yàn)組優(yōu)于對(duì)照組結(jié)論的概率是0.025(2.5%的概率)。這就是說,在針對(duì)這個(gè)終點(diǎn)實(shí)際上沒有療效的情況下,有97.5%的可能性是不優(yōu)于對(duì)照組。 

 

與之比較,如果有兩個(gè)獨(dú)立的終點(diǎn),每個(gè)終點(diǎn)都是雙側(cè)檢驗(yàn),a=0.05,而且針對(duì)每個(gè)終點(diǎn)都得出了藥品有效的結(jié)論,那么兩個(gè)終點(diǎn)合到一起,不能得出有效結(jié)論的概率就是0.975 * 0.975,約為0.95,所以,錯(cuò)誤地判斷為存在療效優(yōu)勢(shì)的概率(也就是在實(shí)際無效卻得出優(yōu)效結(jié)論的概率)上升到了大于0.05. 這樣一來,當(dāng)兩個(gè)終點(diǎn)合并的時(shí)候,有利于判定為藥品有效的I類錯(cuò)誤發(fā)生率增加了為近兩倍。

 

在進(jìn)行多重檢驗(yàn)的時(shí)候,如果未進(jìn)行調(diào)整,這種高于計(jì)劃的I類錯(cuò)誤發(fā)生率稱為多重性問題。因此,如果不對(duì)多重性進(jìn)行改正,對(duì)于這個(gè)研究而言,發(fā)生對(duì)藥品有利的I類錯(cuò)誤的概率會(huì)增加到5%。所以,這種情況下就沒有對(duì)I類錯(cuò)誤進(jìn)行良好的控制。在有兩個(gè)以上的終點(diǎn)的情況下,這個(gè)問題會(huì)更嚴(yán)重。

 

例如,如果有三個(gè)獨(dú)立的終點(diǎn),那么一類錯(cuò)誤率就是 1 - (0.975 * 0.975 * 0.975),大約為7%。在有十個(gè)獨(dú)立終點(diǎn)的情況下,I類錯(cuò)誤率是大約22%。如果這些多個(gè)的終點(diǎn)是相關(guān)的,那么總體I類錯(cuò)誤率也會(huì)膨脹,但但可能程度較低。

 

即使是在評(píng)估單個(gè)結(jié)局變量的時(shí)候,如果需要分析結(jié)局的多個(gè)方面(例如,多個(gè)劑量組、多個(gè)時(shí)間點(diǎn)、基于人口學(xué)或其他特征的多個(gè)亞組),而且如果其中的任何一個(gè)分析都可以得出藥品有效的結(jié)論,分析的多重性也會(huì)導(dǎo)致I類錯(cuò)誤的膨脹。所以,多重性導(dǎo)致I類錯(cuò)誤率的膨脹,產(chǎn)出了對(duì)研究結(jié)果解釋的不確定性,導(dǎo)致通過研究得出的療效結(jié)論變得不可靠。可以采用不同的方法前瞻性地將總體的I類錯(cuò)誤發(fā)生率控制在2.5%或以下。

 

為了對(duì)多重性進(jìn)行控制,有一個(gè)重要的原則是首先前瞻性地對(duì)所有計(jì)劃的終點(diǎn)、時(shí)間點(diǎn)、分析人群、劑量、分析方法進(jìn)行說明;在對(duì)這些因素有了說明以后,可以通過選擇、事先說明和使用,對(duì)多終點(diǎn)進(jìn)行適當(dāng)?shù)恼{(diào)整和分析。更改分析計(jì)劃,進(jìn)行額外的分析也可以產(chǎn)生多重性的問題,對(duì)臨床研究的結(jié)果分析產(chǎn)生負(fù)面影響,除非這些變化是發(fā)生在數(shù)據(jù)分析之前,并且采取了適當(dāng)?shù)拇胧?duì)多重性進(jìn)行了調(diào)整。統(tǒng)計(jì)分析計(jì)劃在治療組揭盲以及進(jìn)行統(tǒng)計(jì)分析以后,不得進(jìn)行修改。

 

本指導(dǎo)原則的重點(diǎn)是對(duì)預(yù)先確定的臨床研究終點(diǎn)(例如主要終點(diǎn)和次要終點(diǎn))I類錯(cuò)誤率的控制,保證對(duì)臨床研究的主要發(fā)現(xiàn)的支持和藥品療效的呈現(xiàn)。

 

對(duì)已經(jīng)證明的、對(duì)終點(diǎn)有影響的特征進(jìn)行解釋,對(duì)這些特征:例如發(fā)病時(shí)間、人群中效應(yīng)大小的分布、亞組的效應(yīng)以及對(duì)復(fù)合終點(diǎn)終某終點(diǎn)的影響,進(jìn)行描述性的分析,這樣就對(duì)終點(diǎn)的特性有了更深入的理解,而不擴(kuò)展到該終點(diǎn)之外的效應(yīng)。這些描述性分析可以被考慮包含在FDA批準(zhǔn)的標(biāo)簽中,而不呈現(xiàn)P值。

 

值得注意的是,在與主要發(fā)現(xiàn)密切相關(guān)的分析和展現(xiàn)其他效應(yīng)的分析之間,不是總明確的差別。所以,當(dāng)要得出確切結(jié)論的時(shí)候,這些分析需要事先確定,并并適當(dāng)?shù)丶{入預(yù)先指定的多重測(cè)試策略中。。如果一個(gè)描述性的分析沒有包含在事先確定的多重檢驗(yàn)策略之中,就不應(yīng)該呈現(xiàn)到FDA批準(zhǔn)的標(biāo)簽上。這樣會(huì)暗示這是一個(gè)嚴(yán)格的統(tǒng)計(jì)方法得出的結(jié)論,或者暗示了療效方面的確定性,但實(shí)際上在研究中沒有支持這種確定性。描述性分析不是本指導(dǎo)原則要討論的問題,所以就不做詳細(xì)的說明了。

 

3、多終點(diǎn):總則

 

終點(diǎn)族的層級(jí)

 

在充分和良好控制的藥物試驗(yàn)中,通常按等級(jí)對(duì)終點(diǎn)進(jìn)行分組,通常根據(jù)其臨床重要性,但也考慮到終點(diǎn)事件的預(yù)期頻率和預(yù)期的藥物效果。。對(duì)終點(diǎn)進(jìn)行分組的關(guān)鍵考量是看這些終點(diǎn)是否構(gòu)成支持藥品審評(píng)的療效或其他有意義的效應(yīng)。那些對(duì)療效有關(guān)鍵作用的、用于支持藥品審評(píng)的終點(diǎn)一般是主要終點(diǎn)。次要終點(diǎn)可以提供有用的說明來支持主要終點(diǎn)和/或體現(xiàn)其他的重要臨床效應(yīng)。層級(jí)中的第三類包括所有其他的終點(diǎn),被稱為探索性的終點(diǎn)。探索性終點(diǎn)可以包括那些用于研究目的的終點(diǎn),或用于產(chǎn)生新的假設(shè)。終點(diǎn)的每個(gè)層級(jí)可以包含單個(gè)的終點(diǎn)或一系列的終點(diǎn)族。

 

(1)主要終點(diǎn)族

 

主要終點(diǎn)族是指那些構(gòu)成藥品的療效,并且是得出研究達(dá)到研究目的結(jié)論的基礎(chǔ)的終點(diǎn)。如果只有一個(gè)事先確定的主要終點(diǎn),就不存在確定研究達(dá)到目的的多終點(diǎn)相關(guān)的多重性問題。

 

多個(gè)主要終點(diǎn)發(fā)生在以下三種情況,在第三章的C部分有更詳細(xì)的描述。第一種情況是,有多個(gè)主要終點(diǎn),其中的每一個(gè)終點(diǎn)都足以證明藥品的療效。這種情況下,多個(gè)終點(diǎn)就產(chǎn)生了多個(gè)成功機(jī)會(huì)。在這種情況下,如果不對(duì)多重性進(jìn)行調(diào)整會(huì)導(dǎo)致I類錯(cuò)誤的膨脹,不能得出藥品有效的結(jié)論。第二種情況是,在有兩個(gè)或多個(gè)終點(diǎn)的情況下,必須所有的終點(diǎn)都達(dá)到才能證明藥品的療效。在這些情況下,這些主要終點(diǎn)就沒有多重性的問題,因?yàn)橹挥幸粭l途徑去獲得研究結(jié)果的成功,所以,不會(huì)導(dǎo)致I類錯(cuò)誤的膨脹。第三種情況是,療效的主要方面可以合并為一個(gè)主要的復(fù)合終點(diǎn)或其他多重復(fù)合終點(diǎn),這也可以避免多終點(diǎn)導(dǎo)致的多重性問題。例如,在很多心血管的研究中,通常將多個(gè)終點(diǎn)進(jìn)行合并(例如:心因性死亡、心梗、中風(fēng))成為主要終點(diǎn),而降死亡作為次要終點(diǎn)(見第III章A2).

 

(2)次要終點(diǎn)族和探索性終點(diǎn)族

 

當(dāng)主要終點(diǎn)的療效得到顯現(xiàn)以后,次要終點(diǎn)可以進(jìn)行正式的檢驗(yàn)。次要終點(diǎn)可以是與主要終點(diǎn)相關(guān)的臨床效果,可以用來擴(kuò)展對(duì)該效果的理解(例如:在一個(gè)心血管產(chǎn)品的主要評(píng)價(jià)終點(diǎn)為心衰導(dǎo)致的住院率時(shí),次要終點(diǎn)為生存率)或者提供與主要評(píng)價(jià)終點(diǎn)要區(qū)別的臨床獲益的證據(jù)(例如在多發(fā)性硬化治療的臨床研究中,主要評(píng)價(jià)終點(diǎn)為復(fù)發(fā)率,將殘疾率作為次要終點(diǎn))。作為一個(gè)通用的原則,如果一個(gè)次要終點(diǎn)將能夠提供潛在的、關(guān)于藥品其他效應(yīng)的證據(jù),也應(yīng)該將這個(gè)次要終點(diǎn)納入I類錯(cuò)誤控制計(jì)劃。

 

通常情況下,會(huì)盡量減少次要終點(diǎn)的數(shù)量,因?yàn)槿绻捎枚嘀匦哉{(diào)整策略,隨著次要終點(diǎn)數(shù)量的增加,證明對(duì)其中任何一個(gè)次要終點(diǎn)確證臨床效應(yīng)的可能性就越小。或者如果s使用層級(jí)機(jī)構(gòu),在底層的重要假設(shè)可能永遠(yuǎn)得不到檢驗(yàn)。

 

探索性終點(diǎn)不需要進(jìn)行多重性的調(diào)整,因?yàn)檫@些終點(diǎn)通常不用于支持藥品的批準(zhǔn)決定。

 

(3)對(duì)主要終點(diǎn)族和次要終點(diǎn)族的選擇和解釋

 

次要終點(diǎn)的陽(yáng)性結(jié)果可以是可以解釋的,如果事先在主要終點(diǎn)族證明了治療效應(yīng)(O’Neill 1997)??傮wI類錯(cuò)誤率的控制可以將主要終點(diǎn)族和次要終點(diǎn)族一起考慮。

 

有時(shí)候,有一些研究的臨床重要終點(diǎn)(例如死亡和不可逆的疾病狀態(tài))發(fā)生率很低,不能為研究提供足夠的把握度,同時(shí)一個(gè)不同的臨床重要終點(diǎn)發(fā)生率較高或者在病程的早期出現(xiàn),可以增加把握度。

 

在這種情況下,通常把握度不高的終點(diǎn)被劃分為次要終點(diǎn),而把握度較高的終點(diǎn)被期望劃分為主要終點(diǎn)。

 

例如,一些腫瘤的研究中,選擇PFS為主要終點(diǎn),而OS選擇為次要終點(diǎn),因?yàn)閷?duì)疾病進(jìn)展的治療效應(yīng)具有臨床重要性,更容易得到驗(yàn)證,可以更早的探測(cè)到,而且可以更大,應(yīng)該觀察到的OS可能會(huì)被疾病進(jìn)展后的后續(xù)的治療所影響。

 

II類錯(cuò)誤和樣本量

 

FDA也關(guān)注II類錯(cuò)誤導(dǎo)致的風(fēng)險(xiǎn)。II類錯(cuò)誤是指實(shí)際存在效果的情況下未能顯示藥物的效果。研究的把握度是在明確了治療效應(yīng)的大小的情況下,研究成功的概率。期望的把握度是確定樣本量的一個(gè)重要因素,特別是對(duì)于主要終點(diǎn)而言。

 

在已經(jīng)知道了主要終點(diǎn)的效應(yīng)大小的情況下,通常通過對(duì)研究的樣本量的選擇,來獲得一個(gè)合理的高把握度,來證明治療效應(yīng)。樣本量的計(jì)算可能需要考慮統(tǒng)計(jì)學(xué)上的調(diào)整,來控制由多重性產(chǎn)出的I類錯(cuò)誤率。例如,如果針對(duì)一個(gè)研究終點(diǎn)采用了較低的率,那么樣本量需要進(jìn)行調(diào)整,以為此終點(diǎn)提供足夠的統(tǒng)計(jì)把握度。

 

使用兩個(gè)或兩個(gè)以上的終點(diǎn),每個(gè)終點(diǎn)都證明治療效應(yīng),以支持藥品審批(又稱為聯(lián)合主要終點(diǎn),見第III章的C1節(jié)),這種方式會(huì)增加II類錯(cuò)誤的發(fā)生率,降低研究的把握度。

 

例如,假設(shè)兩個(gè)終點(diǎn)有同樣的效應(yīng)幅度,而且研究的樣本量可以提供80%的把握度來給每個(gè)終點(diǎn)表示成功。如果兩個(gè)終點(diǎn)是彼此獨(dú)立的,那么兩個(gè)終點(diǎn)成功的概率是64%(0.8 x 0.8);在這些情況下,當(dāng)存在有利的藥物效應(yīng)時(shí),研究不能成功支持得出藥品有效結(jié)論的可能性為36%。為了維持期望的把握度,就需要增加樣本量,而且每個(gè)終點(diǎn)的把握度要達(dá)到大約90%來保證成功的概率至少為80%。如果終點(diǎn)有很強(qiáng)的相關(guān)性或者不同終點(diǎn)的把握度不同,會(huì)有不同的計(jì)算方法。

 

多終點(diǎn)的種類

 

如果需要證明藥品效應(yīng)體現(xiàn)在疾病或臨床結(jié)局的多個(gè)方面,這對(duì)確定藥品產(chǎn)生的臨床獲益非常重要,那么久需要采用多終點(diǎn)的方法。多終點(diǎn)也可以用于以下的情況:(1)一個(gè)疾病有多個(gè)重要的方面或有不同的方法去評(píng)估一個(gè)重要方面,(2)無法事先知道那個(gè)終點(diǎn)最能體現(xiàn)藥品的效應(yīng),和(3)任何一個(gè)終點(diǎn)的效應(yīng)都可以足夠支持藥品的審批。在很多情況下,疾病的多個(gè)方面可以適當(dāng)?shù)睾喜橐粋€(gè)終點(diǎn),但之后的分析,針對(duì)疾病的每個(gè)方面或終點(diǎn)的每個(gè)部分進(jìn)行檢查,就變得很重要,這樣才能獲得對(duì)藥品效應(yīng)的正確理解。這種情況下下文中會(huì)進(jìn)行詳細(xì)的討論。

 

(1)當(dāng)兩個(gè)或兩個(gè)以上獨(dú)立的終點(diǎn)(聯(lián)合主要終點(diǎn))來證明治療效應(yīng)的時(shí)候

 

對(duì)于某些疾病,有兩個(gè)或多個(gè)特征對(duì)于所研究的疾病來講非常重要,如果藥品不能對(duì)所有的疾病特征有效的話,就不能認(rèn)為這個(gè)藥品有效。本指導(dǎo)原則用來描述這種多個(gè)主要終點(diǎn)的情況所采用的術(shù)語(yǔ)是聯(lián)合主要終點(diǎn)。在各個(gè)終點(diǎn)都體現(xiàn)出療效才能說明藥品有效的時(shí)候,多個(gè)主要終點(diǎn)就變?yōu)槁?lián)合主要終點(diǎn)。

 

對(duì)急性偏頭痛的治療可以描述這種情況。雖然疼痛是最重要的特點(diǎn),偏頭痛還有畏光、恐音和/或惡心,所有這些癥狀都有臨床上的重要性。在這三個(gè)癥狀中,那個(gè)是最重要的,因人而異。

 

在對(duì)急性偏頭痛進(jìn)行治療臨床研究中,只有在部分受試者服藥后2小時(shí)沒有頭疼,同時(shí)部分受試者服藥后2小時(shí)沒有最難受的癥狀,在兩者都得到改善的情況下,才會(huì)要考慮藥品對(duì)偏頭痛的療效。

 

另外一個(gè)方法是用反應(yīng)終點(diǎn)來評(píng)估藥品效應(yīng)。反應(yīng)終點(diǎn)是疼痛和根據(jù)個(gè)人情況來確定的同一受試者的第二癥狀的消除。這種方法會(huì)用到包含多個(gè)成分的單終點(diǎn),而非聯(lián)合主要終點(diǎn)。

 

組合疫苗的臨床研究也是需要采用聯(lián)合主要終點(diǎn)的情況。這些疫苗的研究采用經(jīng)典的設(shè)計(jì),采用有足夠的把握度以獲得成功的結(jié)果,每個(gè)療效終點(diǎn)是針對(duì)每種病原體,評(píng)估疫苗所提供的保護(hù)情況。

 

正如在第III章B節(jié)中所討論的,當(dāng)研究旨在證明對(duì)所有獨(dú)立終點(diǎn)的有效性時(shí),不存在多重性問題。然而,聯(lián)合主要終點(diǎn)的檢驗(yàn)增加了第二類錯(cuò)誤率。一般來說,除非臨床非常重要,否則在使用兩個(gè)以上的聯(lián)合主要終點(diǎn)應(yīng)仔細(xì)考慮,因?yàn)檫@樣會(huì)減少把握度。

 

有人建議,當(dāng)目標(biāo)a為0.05時(shí),可以增加每個(gè)聯(lián)合主要終點(diǎn)的統(tǒng)計(jì)檢驗(yàn)標(biāo)準(zhǔn)(例如,在a為0.06或0.07時(shí)進(jìn)行檢驗(yàn)),以適應(yīng)因需要顯示對(duì)兩個(gè)終點(diǎn)的影響而導(dǎo)致的統(tǒng)計(jì)效能的損失。增加每個(gè)聯(lián)合主要終點(diǎn)的a是不可接受的,因?yàn)檫@樣做可能會(huì)破壞對(duì)疾病不同方面的治療效果的解釋能力,這些治療效果被認(rèn)為是證明藥物有效、支持批準(zhǔn)的關(guān)鍵。

 

(2)如果在多個(gè)終點(diǎn)中,有至少一個(gè)終點(diǎn)反映了治療效應(yīng)就足夠的情況

 

許多疾病有多重后遺癥。針對(duì)任何一種后遺癥有效,都可以支持有效性的結(jié)論。如果事先不知道疾病的哪些方面會(huì)對(duì)藥物有反應(yīng),或者不知道是否有更好的檢驗(yàn)治療效果的方法(在研究設(shè)計(jì)時(shí)),選擇單一的主要終點(diǎn)可能是困難的。在這種情況下,研究可以設(shè)計(jì)為在幾個(gè)終點(diǎn)中的任何一個(gè)成功都可以支持有效性的結(jié)論。這就建立了一個(gè)主終點(diǎn)族。例如,對(duì)于一種用于治療燒傷的藥物,目前尚不清楚該藥物是否會(huì)增加傷口愈合率或減少疤痕,但只要能證明其中一種效果就被認(rèn)為是有臨床重要性的。在這種情況下,研究可能將傷口愈合率和疤痕測(cè)量作為單獨(dú)的主要終點(diǎn)。

 

(3)復(fù)合終點(diǎn)

 

在某些疾病的臨床試驗(yàn)中,有一個(gè)以上的臨床結(jié)果是重要的,所有的臨床結(jié)果都將受到治療的影響。與其將每個(gè)臨床結(jié)果作為單獨(dú)的主要終點(diǎn)(產(chǎn)生多重性),或只選擇其中一個(gè)作為主要終點(diǎn),指定其他的終點(diǎn)為次要終點(diǎn),不如將這些臨床結(jié)果合并為一個(gè)單一變量。這通常被稱為復(fù)合終點(diǎn),可以將某特定事件的發(fā)生或完成作為復(fù)合終點(diǎn)。舉一個(gè)典型的例子:在心血管研究中將主要不良臨床結(jié)局事件作為復(fù)合終點(diǎn)(例如,將心肌梗死、中風(fēng)或死亡作為復(fù)合終點(diǎn))。當(dāng)終點(diǎn)的不同成分對(duì)應(yīng)不同的事件時(shí),通常是在任何一個(gè)終點(diǎn)成分第一次出現(xiàn)時(shí)進(jìn)行終點(diǎn)評(píng)估。如果針對(duì)復(fù)合終點(diǎn)進(jìn)行單個(gè)統(tǒng)計(jì)檢驗(yàn),則該終點(diǎn)不會(huì)出現(xiàn)多重性問題。

 

使用復(fù)合終點(diǎn)的一個(gè)可能的原因是,每個(gè)事件的發(fā)生率可能太低,導(dǎo)致研究在合理的樣本量下不能有足夠的把握度; 采用復(fù)合終點(diǎn)可以獲得足夠高的總事件發(fā)生率,在樣本量和研究持續(xù)時(shí)間合理的情況下,研究也具有足夠的把握度。復(fù)合終點(diǎn)也通常使用于治療的目標(biāo)是預(yù)防或延遲某臨床重要并相關(guān)的事件的發(fā)生(例如,在冠心病患者中使用抗血小板藥物來預(yù)防心肌梗死、中風(fēng)或死亡)時(shí),可能并不知道哪些事件可能受到影響。

 

應(yīng)謹(jǐn)慎選擇復(fù)合終點(diǎn)的組成成分。當(dāng)單個(gè)事件的臨床重要性都很相似時(shí),可以認(rèn)為對(duì)復(fù)合事件率的治療效應(yīng)可代表整體的臨床效果。然而,如果不同成分的臨床重要性有很大差異,且治療效應(yīng)主要是體現(xiàn)在最不重要的事件上,那么對(duì)復(fù)合終點(diǎn)的影響就不能代表對(duì)所有成分的影響標(biāo),也就不能準(zhǔn)確描述藥物的療效。

 

此外,即使一個(gè)或多個(gè)不那么重要的事件類型受到了有利的影響,也有可能一個(gè)更重要的成分會(huì)在接受治療后產(chǎn)生的不利影響,因此,盡管總體的統(tǒng)計(jì)結(jié)果是有利的,但這種治療的臨床價(jià)值是可疑的。在這種情況下,盡管總體統(tǒng)計(jì)分析表明治療是有益的,但通過對(duì)數(shù)據(jù)的仔細(xì)檢查,可能會(huì)對(duì)這一結(jié)論提出質(zhì)疑。因此,為了更深入地了解治療的效應(yīng),對(duì)復(fù)合終點(diǎn)的組成部分的分析很重要(見第三章D節(jié)),并可能對(duì)整個(gè)研究結(jié)果的解釋產(chǎn)生影響。

 

對(duì)各成分的檢查總是必要的,但是否要對(duì)多重性進(jìn)行調(diào)整,這取決于研究目的。如果研究的目的是為了更好地理解對(duì)復(fù)合終點(diǎn)效應(yīng),則不建議進(jìn)行多重性調(diào)整。在這種情況下,需要通過臨床判斷來確定獲益是否具有臨床意義,而且獲益多于風(fēng)險(xiǎn),以及如何在FDA批準(zhǔn)的標(biāo)簽中進(jìn)行描述。如果目的是建立藥物的其他效應(yīng),那么應(yīng)該進(jìn)行多重性調(diào)整。

 

(4)多成分的終點(diǎn)

 

多成分終點(diǎn)是兩個(gè)或多個(gè)成分的個(gè)體內(nèi)組合。針對(duì)這一終點(diǎn),對(duì)個(gè)體的評(píng)價(jià)依賴于對(duì)該個(gè)體中所有指定成分的觀察。然后根據(jù)指定的規(guī)則確定對(duì)個(gè)體的整體評(píng)級(jí)或確定個(gè)體的整體狀態(tài)。

 

單個(gè)個(gè)體的總體評(píng)分可以由單個(gè)域得分的某種平均值(加權(quán)或不加權(quán))組成。多成分終點(diǎn)的一個(gè)例子是精神分裂癥研究中的陽(yáng)性和陰性綜合征量表(PANSS)。多成分終點(diǎn)也可以是二分變量(響應(yīng)),對(duì)應(yīng)于每個(gè)個(gè)體針對(duì)多成分中的每個(gè)成分是否能達(dá)到指定的標(biāo)準(zhǔn)。例如,在異體胰島細(xì)胞治療1型糖尿病的臨床研究中,主要終點(diǎn)可以是反應(yīng)率,但只有受試者同時(shí)滿足兩個(gè)二分反應(yīng)標(biāo)準(zhǔn): HbA1c正常范圍和低血糖消除,才被認(rèn)為是有反應(yīng)。

 

還有更復(fù)雜的終點(diǎn)公式,其中一種疾病的幾種(但不是全部)不同特征必須受到積極影響,才能被視為受益。例如,在美國(guó)風(fēng)濕病學(xué)會(huì)(ACR)的類風(fēng)濕關(guān)節(jié)炎評(píng)分系統(tǒng)中,對(duì)單個(gè)受試者的有效的反應(yīng)可能被定義為對(duì)一種疾病的兩個(gè)特定方面有一定程度的改善,以及至少五個(gè)附加疾病特征中的三個(gè)得到改善。

 

如果對(duì)不同成分的治療效應(yīng)在一個(gè)受試者內(nèi)總體上呈相同的趨勢(shì),那么使用受試者內(nèi)多成分終點(diǎn)可能是高效率的。

 

然而,如果終點(diǎn)之間的一致性有限,對(duì)研究的把握度可能會(huì)產(chǎn)生不利影響。

 

雖然與聯(lián)合終點(diǎn)相比,多組份終點(diǎn)可以提供更高的效率,但研究對(duì)象內(nèi)特定多組份終點(diǎn)是否是適當(dāng)?shù)?,這通常是由臨床而不是統(tǒng)計(jì)來決定的。

 

類似于第III章C3節(jié)中對(duì)復(fù)合終點(diǎn)的各個(gè)終點(diǎn)成分的評(píng)估,在美國(guó),對(duì)多成分終點(diǎn)的某成分的評(píng)估可能也是重要的,但如果研究目的是為了支持治療如何影響某特定成分的結(jié)論,則應(yīng)事先說明并進(jìn)行多重性調(diào)整(見第III章D節(jié))。

 

(5)關(guān)鍵臨床終點(diǎn)過于罕見,不能用作主要終點(diǎn)

 

對(duì)于許多嚴(yán)重的疾病,有的終點(diǎn)是有重要臨床意義的。不對(duì)這樣的終點(diǎn)數(shù)據(jù)進(jìn)行收集和分析是不合理的;常見的例子是死亡或主要發(fā)病事件(如中風(fēng)、骨折、肺功能衰竭)。如果藥物對(duì)復(fù)合主要終點(diǎn)的影響已被證實(shí),即使在研究中這些事件的發(fā)生相對(duì)較少,也可以將這些事件包含在復(fù)合終點(diǎn)中(見第III章C3節(jié)),并做為次要終點(diǎn),可能可以支持對(duì)該終點(diǎn)產(chǎn)生效應(yīng)的結(jié)論。

 

復(fù)合終點(diǎn)和多成分終點(diǎn)的單個(gè)成分

 

(1)對(duì)復(fù)合終點(diǎn)的結(jié)果的評(píng)估和報(bào)告

 

對(duì)于其成分與事件對(duì)應(yīng)的復(fù)合終點(diǎn),事件通常定義為任何指定成分事件的第一次出現(xiàn)。這樣的復(fù)合終點(diǎn)可以在研究結(jié)束時(shí)通過比較研究組之間的比例或使用時(shí)間-事件分析進(jìn)行分析。

 

當(dāng)在研究的觀察時(shí)間范圍內(nèi),無事件的持續(xù)時(shí)間具有臨床意義時(shí),時(shí)間-事件分析方法是更常見的方法。盡管人們可能期望藥物對(duì)復(fù)合終點(diǎn)的所有成分都有良好的效果,但這并不一定。

 

因此,每個(gè)成分事件的結(jié)果應(yīng)單獨(dú)審查,并應(yīng)包括在研究報(bào)告中。這些分析不會(huì)改變關(guān)于復(fù)合主要終點(diǎn)的統(tǒng)計(jì)學(xué)顯著性的結(jié)論。然而,對(duì)復(fù)合終點(diǎn)結(jié)果的解釋可能是不確定的(見第III章C3節(jié))。如果有興趣將復(fù)合終點(diǎn)的一個(gè)或多個(gè)成分作為不同的假設(shè)來分析,以證明藥物的效果,這些假設(shè)應(yīng)該是預(yù)先指定的統(tǒng)計(jì)分析計(jì)劃的一部分,該計(jì)劃應(yīng)考慮到,如上所述的死亡率的分析,將產(chǎn)生的多重性。但是,對(duì)單個(gè)終點(diǎn)成分的檢驗(yàn)可能沒有足夠的檢驗(yàn)效能,因?yàn)闃颖玖炕蚴录倲?shù)通常是根據(jù)對(duì)復(fù)合終點(diǎn)的檢驗(yàn)來計(jì)算的。

 

通常對(duì)首個(gè)復(fù)合事件進(jìn)行分解,以描述各事件組成部分在復(fù)合事件中所占的比例。例如,在RENAAL研究中(Brenner et al. 2001),主要療效終點(diǎn)是首次出現(xiàn)兩倍血清肌酐水平、終末期腎病或死亡的復(fù)合終點(diǎn)。基于這種分解,52%的首發(fā)復(fù)合事件是血清肌酐水平加倍,19%是終末期腎臟疾病事件,29%是死亡。然而,受試者可能經(jīng)歷不止一種事件類型。對(duì)于這些受試者,在第一次復(fù)合事件之后發(fā)生的事件(例如,終末期腎臟疾病或血清肌酐翻倍后發(fā)生的死亡)不會(huì)進(jìn)行分解統(tǒng)計(jì)。因此,在對(duì)包含相關(guān)事件類型的所有事件(甚至是發(fā)生在其他類型事件之后的事件)的分析中,對(duì)單個(gè)事件類型的評(píng)估也很重要。這樣的分析可以證明藥物可能的額外效果,如果它們是預(yù)先指定的、充分考慮了多重性、并且結(jié)果是可解釋的。

 

(2)評(píng)估和報(bào)告其他多成分終點(diǎn)的結(jié)果

 

與復(fù)合終點(diǎn)一樣,了解受試者內(nèi)多成分終點(diǎn)的哪些成分對(duì)總體統(tǒng)計(jì)顯著性貢獻(xiàn)最大,這對(duì)于正確理解藥物的臨床效果可能很重要。因此,對(duì)單個(gè)成分的研究結(jié)果的分析通常是重要的,但如前所述,如果進(jìn)行了這樣的分析,不應(yīng)在FDA批準(zhǔn)的標(biāo)簽中暗示這是統(tǒng)計(jì)學(xué)上嚴(yán)謹(jǐn)?shù)慕Y(jié)論或傳達(dá)以確定性的方式總結(jié)該研究不支持的效應(yīng)。對(duì)于許多這些多成分終點(diǎn),綜合評(píng)分被認(rèn)為是全面的,而且是臨床上可解釋的。然而,單個(gè)成分量表可能或不能是獨(dú)自具有臨床上的解釋。將臨床結(jié)果評(píng)估的某個(gè)特定組成部分或子域作為主要或次要終點(diǎn)家族中的明確終點(diǎn)進(jìn)行分析是合理的,前提是該終點(diǎn)在臨床上是可解釋的。如果為了表明除總體多成分終點(diǎn)外,藥物對(duì)一個(gè)或多個(gè)這些終點(diǎn)的作用,建議對(duì)這些特定的終點(diǎn)成分或子域進(jìn)行多重性的控制。

 

4、方法學(xué)的考慮

 

在第II章和第III章討論了產(chǎn)生多重性的各種情況。

 

當(dāng)存在一系列終點(diǎn)時(shí)(在第III章A節(jié)中討論),無論其他終點(diǎn)是否存在治療效果,在至少一個(gè)終點(diǎn)中錯(cuò)誤地發(fā)現(xiàn)統(tǒng)計(jì)上顯著的治療效果的概率為總體I類錯(cuò)誤概率。這個(gè)錯(cuò)誤率通常保持在0.05(或單側(cè)檢驗(yàn)的0.025)。將錯(cuò)誤率控制在所需水平的統(tǒng)計(jì)方法可以在單個(gè)終點(diǎn)上得出有效的結(jié)論。

 

有許多常用的統(tǒng)計(jì)方法來解決多終點(diǎn)相關(guān)的多重性問題(Hochberg和Tamhane 1987)。

 

附錄給出了一些常用的統(tǒng)計(jì)學(xué)方法。例如Bonferroni, Holm (Holm 1979)和Hochberg (Hochberg 1988)程序,這些方法在無效假設(shè)上不假定任何層次(例如,終點(diǎn)族中的任何單個(gè)無效假設(shè)都可以被拒絕,而不管其他假設(shè)是否被拒絕)。其他可行的方法結(jié)合了部分alpha分配和分層,如附錄中的圖形方法(Bretz et al. 2009)。如果在任何一個(gè)被考察的終點(diǎn)中發(fā)現(xiàn)統(tǒng)計(jì)學(xué)上有顯著性意義的治療效應(yīng)被認(rèn)為是成功的,那么就應(yīng)該采用適當(dāng)?shù)姆椒?,?duì)終點(diǎn)族的多重性進(jìn)行調(diào)整。

 

然而,如果基于臨床上的重要性,終點(diǎn)是有序的,或在邏輯上是相關(guān)的,那么可以推薦不同的方法(例如,Pocock等人,2012)。例如,對(duì)于一個(gè)簡(jiǎn)單的情況,只有一個(gè)主要終點(diǎn)和一個(gè)次要終點(diǎn),可以使用分層檢驗(yàn)方法。已經(jīng)開發(fā)了一些方法來解釋終點(diǎn)之間更復(fù)雜的邏輯/層次關(guān)系,如圖形法(例如,Bretz等,2009)和mixture gatekeeping程序(Dmitrienko等,2008)。

 

圖形法具有順序檢驗(yàn)算法,并且可以通過圖形可視化測(cè)試過程。

 

在某些情況下,一個(gè)主要終點(diǎn)要先進(jìn)行非劣效檢驗(yàn)(固定界值),然后進(jìn)行優(yōu)效性檢驗(yàn)。如果這個(gè)終點(diǎn)是進(jìn)行統(tǒng)計(jì)檢驗(yàn)的唯一終點(diǎn),那么非劣性和優(yōu)效性檢驗(yàn)可以不需要對(duì)多重性進(jìn)行調(diào)整,因?yàn)榉橇有院蛢?yōu)效性檢驗(yàn)的無效假設(shè)是自然有序的,并且兩個(gè)檢驗(yàn)都是在該終點(diǎn)的同一層級(jí)。但是,如果統(tǒng)計(jì)檢驗(yàn)包含了至少有一個(gè)終點(diǎn),那么就會(huì)出現(xiàn)多重性的問題,應(yīng)該對(duì)多重性進(jìn)行調(diào)整,以控制總體的I類錯(cuò)誤的概率。

 

例如,統(tǒng)計(jì)檢驗(yàn)可以通過排序,在一個(gè)層級(jí)中開展,其中附加終點(diǎn)在主終點(diǎn)的優(yōu)效假設(shè)之后進(jìn)行檢驗(yàn)?;蛘撸硗庖粋€(gè)方法是,可以在對(duì)主要終點(diǎn)進(jìn)行優(yōu)效性假設(shè)檢驗(yàn)的同時(shí),對(duì)附加終點(diǎn)進(jìn)行假設(shè)檢驗(yàn),并在多個(gè)假設(shè)之間進(jìn)行alpha分配。為了了解為什么這樣的alpha分配是適用的,假設(shè)藥物就主要終點(diǎn)而言不劣于陽(yáng)性對(duì)照,但對(duì)于藥物既不在主要終點(diǎn)優(yōu)于陽(yáng)性對(duì)照,也不在次要終點(diǎn)上非劣于的陽(yáng)性對(duì)照。在這種情況下,I類錯(cuò)誤可能發(fā)生在這些假設(shè)檢驗(yàn)中的任何一個(gè)。如果這兩項(xiàng)都以0.05的顯著性水平進(jìn)行檢驗(yàn),那么其中至少一項(xiàng)導(dǎo)致錯(cuò)誤結(jié)論的概率將大于0.05。

 

因此,應(yīng)該以某種方式進(jìn)行適當(dāng)?shù)目刂疲ɡ?,只有在主終點(diǎn)的優(yōu)效性顯示出來后才測(cè)試次要終點(diǎn),或者在兩個(gè)測(cè)試之間進(jìn)行alpha分割)。關(guān)于這一特殊情況和其他方法上的考慮的進(jìn)一步討論載于附錄中。

 

— 總結(jié) —

 

對(duì)療效做出錯(cuò)誤的有效的結(jié)論(即,錯(cuò)誤地認(rèn)為一種藥物具有積極的治療效果,但實(shí)際上是無效的)是一個(gè)主要的問題。一種常見的方法是:對(duì)于存在治療差異的錯(cuò)誤結(jié)論,將I類錯(cuò)誤率控制在5%(1 / 20的幾率)以下,對(duì)于有效性的假陽(yáng)性結(jié)論,控制在2.5%(1 / 40的幾率)以下。隨著終點(diǎn)數(shù)量或分析數(shù)量的增加,由于多重性的影響,I類錯(cuò)誤率可能會(huì)遠(yuǎn)遠(yuǎn)超過2.5%。

 

如本指導(dǎo)原則所述,在采用多終點(diǎn)評(píng)估藥物療效時(shí),多重性調(diào)整為對(duì)I類錯(cuò)誤率的控制提供了方法。如本指導(dǎo)原則所述,可酌情使用許多策略和方法。這些方法各有優(yōu)缺點(diǎn),選擇合適的策略和方法是研究計(jì)劃階段必須迎接的挑戰(zhàn)。應(yīng)利用統(tǒng)計(jì)專業(yè)知識(shí)來幫助選擇最適當(dāng)?shù)姆椒?。如果不能適當(dāng)?shù)貙?duì)I類錯(cuò)誤率進(jìn)行控制,就會(huì)增加假陽(yáng)性結(jié)論的風(fēng)險(xiǎn);本指導(dǎo)原則旨在闡明何時(shí)以及如何管理由多個(gè)終點(diǎn)引起的多重性,以避免得出錯(cuò)誤的結(jié)論。

 

分享到:

來源:同寫意

相關(guān)新聞: