中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

您當前的位置:檢測資訊 > 科研開發(fā)

利用真實世界數(shù)據(jù)的上市后藥品安全監(jiān)測的統(tǒng)計學方法綜述

嘉峪檢測網(wǎng)        2021-12-25 22:30

利用真實世界數(shù)據(jù)的上市后藥品安全監(jiān)測的統(tǒng)計學方法綜述

 

From Real-World Data to Safety Monitoring: A Overview of Statistical Methods in Post-Marketing Safety Surveillance

 

摘要  Abstract 

 

藥品不良反應,特別是危及生命的藥品不良反應,是患者、臨床醫(yī)生和監(jiān)管機構(gòu)的重要關(guān)注點。嚴重藥品不良反應的發(fā)現(xiàn)常伴隨強制性四期臨床試驗、說明書中的黑框警告或者最終被迫退出市場。監(jiān)管方、支付方和供應方一直致力于利用真實世界數(shù)據(jù)為包括上市后藥品安全監(jiān)測在內(nèi)的藥品全生命周期管理提供高質(zhì)高效的決策支持。本文按照不同類型的真實世界數(shù)據(jù),對上市后藥品安全監(jiān)測相關(guān)統(tǒng)計方法進行回顧和概述,包括基于自發(fā)報告系統(tǒng)、電子健康記錄、保險索賠數(shù)據(jù)以及混合數(shù)據(jù)源的方法。不僅涵蓋了開發(fā)成熟、得到廣泛應用的方法(如比值失衡分析法、疫苗監(jiān)測中的最大序貫統(tǒng)計檢驗方法等),還包括仍處于開發(fā)驗證階段的方法(如腫瘤藥物監(jiān)測中的最大序貫統(tǒng)計檢驗方法、藥物警戒專用數(shù)據(jù)處理管道等)。本文主要介紹了各方法的適用場景及優(yōu)劣,并結(jié)合實例進行闡述。此外,還就真實世界數(shù)據(jù)二次使用過程中的注意事項、安全信號再評估的必要性、統(tǒng)計學方法的底層假設、新興方法在未來的使用和推廣進行了討論。

 

Adverse drug reactions (ADRs), especially life-threatening ADRs, have been a major concern for patients, clinicians,and regulatory agencies. The identification of serious ADRs usually results in mandatory phase IV clinical trials, black box warnings on the label, or even drug withdrawal from the market. Regulators, payers, and health providers have been leveraging real-world data for effective and efficient decision-making throughout the product life cycle. We reviewed several statistical methods for post-marketing safety surveillance, including methods based on spontaneous reporting databases, electronic health records and insurance claim data, as well as methods based on mixed sources. Some of these approaches are welldeveloped and widely applied (e.g., disproportionality analysis, MaxSPRT in vaccine surveillance), while others are still emerging or experimental (e.g., MaxSPRT in oncology drug surveillance, pharmacovigilance data processing pipeline). This paper evaluates the applicable scenarios, strengths and weaknesses of these methods, and provides examples. In addition,we discuss the issues of re-using real-world data, the necessity of re-evaluating safety signals, the underlying assumption of those statistical methods, as well as the challenges and opportunities of emerging methods.

 

關(guān)鍵詞  Key words 

 

真實世界數(shù)據(jù);上市后安全監(jiān)測;統(tǒng)計方法;自發(fā)報告系統(tǒng);縱向觀察性數(shù)據(jù)

 

real-world data; post-marketing safety surveillance; statistical methods; spontaneous reporting system;longitudinal observational database

 

藥品不良反應是目前備受關(guān)注的公共衛(wèi)生問題之一,是十大致死原因之一。在美國,每年由藥品不良反應所造成的疾病經(jīng)濟負擔高達750 億美元[1]。目前,藥物警戒主要分為上市前評審和上市后監(jiān)測兩部分。由于在上市前評審中通過體內(nèi)或體外試驗發(fā)現(xiàn)新藥和現(xiàn)有藥品之間所有可能的相互作用十分困難,因此對藥品上市后安全性進行監(jiān)測是非常必要的[2]。

 

上市后藥品安全監(jiān)測主要依賴于真實世界數(shù)據(jù),需要綜合使用多種統(tǒng)計分析方法。用于上市后監(jiān)測的真實世界數(shù)據(jù)通常包括自發(fā)報告系統(tǒng)(spontaneous reporting system, SRS)、電子健康記錄(electronic health record,EHR)和保險索賠數(shù)據(jù)等[3]。其中,SRS 數(shù)據(jù)是上市后藥品安全監(jiān)測的關(guān)鍵資源,包含由患者和醫(yī)療保健專業(yè)人員報告的可疑藥品不良反應,屬于被動監(jiān)測模式下收集的數(shù)據(jù)[3-4]。然而,僅依賴SRS 數(shù)據(jù)的藥物警戒具有很大的局限性。通常,SRS 數(shù)據(jù)漏報率較高,無法提供用藥人群的基數(shù),進而無法計算不良反應的發(fā)生率和風險,且在數(shù)據(jù)變量上SRS 數(shù)據(jù)缺少準確時間信息,導致患者暴露時長信息的缺失[3-5]。相比之下,EHR 和保險索賠數(shù)據(jù)均屬于主動監(jiān)測模式下收集的數(shù)據(jù),可以提供用藥人群的基數(shù),包含患者的縱向隨訪信息,可提取暴露時長數(shù)據(jù)[3,5]。因此,上市后藥品安全監(jiān)測應綜合考慮不同來源和類型的數(shù)據(jù),特別是綜合了多種來源數(shù)據(jù)的混合數(shù)據(jù)源數(shù)據(jù)。

 

本文從真實世界數(shù)據(jù)類型出發(fā),對上市后藥品安全監(jiān)測的統(tǒng)計分析方法展開論述。分別對適用于基于被動監(jiān)測模式下的SRS 以及基于主動監(jiān)測模式下的EHR、保險索賠數(shù)據(jù)等縱向觀察性數(shù)據(jù)的統(tǒng)計方法,以及連續(xù)監(jiān)測方法進行介紹。主要介紹了各方法的適用場景、優(yōu)劣以及注意事項,并結(jié)合實例進行闡述;討論了新興方法在未來的使用和推廣中可能遇到的機遇和挑戰(zhàn)。

 

01基于SRS 的上市后藥品安全監(jiān)測

 

目前, 比值失衡分析法常用于SRS 的上市后藥品安全監(jiān)測。該方法的假設是:若藥品與某些不良事件存在因果關(guān)聯(lián),那么該藥品- 不良事件組合的實際發(fā)生數(shù)將超過預期,即二者的比值出現(xiàn)失衡,當比值失衡的程度超過事先界定的閾值時, 則可認為出現(xiàn)一個安全信號[6]。藥品- 不良事件組合比值失衡程度的計算基于2×2 四格表(表1), 表2 總結(jié)了衡量比值失衡程度的常見指標, 包括報告比(reporting ratio,RR)、信息成分(information component,IC)、比例報告比(proportiona lreporting ratio,PRR)、報告比值比(reporting odds ratio,ROR)[4,7]。

 

利用真實世界數(shù)據(jù)的上市后藥品安全監(jiān)測的統(tǒng)計學方法綜述

 

利用真實世界數(shù)據(jù)的上市后藥品安全監(jiān)測的統(tǒng)計學方法綜述

 

比值失衡分析法的假設檢驗主要有頻數(shù)學派和貝葉斯學派2 種方法。頻數(shù)學派方面, 安全信號的檢測既可通過對比值失衡指標95% 可信區(qū)間的下限是否大于0 進行檢驗, 也可進行卡方檢驗[6]。此外, 一些機構(gòu)[ 如英國藥品和保健產(chǎn)品管理局(Medicines and Healthcare Products Regulatory Agency,MHRA)] 采用結(jié)合了多個指標的綜合判定法, 將比例報告比、實際報告數(shù)和基于比例報告比的卡方檢驗統(tǒng)計量作為信號的判定標準[7]。貝葉斯學派方面, 安全信號檢測方法主要包括貝葉斯可信區(qū)間遞進神經(jīng)網(wǎng)絡法(Bayesian Confidence Propagation Neural Network,BCPNN) 和伽馬泊松壓縮法(Gamma Poisson Shrinker,GPS),二者均基于報告比,分別由世界衛(wèi)生組織烏普薩拉監(jiān)測中心和美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA) 不良事件報告系統(tǒng)(Adverse Event Reporting System,AERS)建立和使用[8-10]。BCPNN 法通過假設藥品、不良事件的先驗概率P(A)、P(D)服從獨立Beta(1,1)分布,利用貝葉斯原理計算信息成分值,即Log2(RR),對安全信號進行檢測。GPS 法則假設藥品- 不良事件組合的實際發(fā)生數(shù)服從泊松分布,且該組合的發(fā)生率服從包含2 個負二項分布的混合分布,于是報告比服從包含2個Gamma 分布的混合分布,并利用貝葉斯原理計算經(jīng)驗貝葉斯幾何均數(shù)(Empirical Bayesian Geometric Mean,EBGM) 以反映報告比。二者的主要區(qū)別為:① BCPNN 法采用無信息先驗,而GPS 法的先驗分布基于收集得到的樣本信息,其先驗分布中的超參數(shù)通過極大似然估計的方法確定;② BCPNN 法的安全信號常用判別準則為IC-2SD > 0(SD 為IC 的標準差), 而GPS法的安全信號判別準則為EBGM的90% 可信區(qū)間的下限(EB05)不小于2[8-10]。多項伽馬泊松壓縮法(Multi-item Gamma Poisson Shrinker,MGPS) 是對GPS 法的改進,可通過依協(xié)變量分層計算期望發(fā)生數(shù)的方法,達到調(diào)整協(xié)變量的目的[11]。然而無論采用何種方法,均無法彌補SRS 缺少分母信息的缺點,因此無法進行風險估計。此外,上述方法在多重檢驗過程中均未考慮第一類錯誤的控制,故采用以上方法進行安全信號檢測時第一類錯誤可能發(fā)生膨脹[12]。

 

van Puijenbroek 等[13] 分析了頻數(shù)學派在SRS 中檢測安全信號的表現(xiàn)。結(jié)果顯示, 若以BCPNN 法為金標準, 基于比例報告比或報告比值比的區(qū)間估計法以及卡方檢驗的靈敏度很高(即檢測出真實信號的可能性很大)但特異度低(即假陽性的可能性也很大),隨著報告數(shù)的增加,特異度和陽性預測值均上升。Dumouchel 等[10] 發(fā)現(xiàn), 當藥品- 不良事件組合的實際發(fā)生數(shù)很小時,報告比的估計值將十分極端。例如,阿卡波糖- 肝癌組合的實際發(fā)生數(shù)為1、期望發(fā)生數(shù)為0.00036,此時的報告比高達2817。相反,若采用GPS 法,上述阿卡波糖- 肝癌組合最終的EBGM 值僅為2.4,結(jié)果則十分保守。然而隨著組合實際發(fā)生數(shù)的增加,報告比與EBGM 將逐漸接近。例如,碘他拉酸- 蕁麻疹組合的實際發(fā)生數(shù)為2924、期望發(fā)生數(shù)為248.9,該組合的報告比和EBGM 值均為11.8。因此,貝葉斯學派的方法對于罕見安全信號的檢測更為穩(wěn)健[10]。

 

綜上,比值失衡分析法通過一些常用的閾值比較規(guī)則得到陽性信號,雖然簡單直觀,但是存在假陽性和假陰性的問題相較于假設檢驗的方法更為明顯。因此,不能直接只基于信號檢測的結(jié)果進行因果關(guān)聯(lián)的判斷,但可以在后續(xù)對信號深入的評估和分析中更充分地使用[4,6]。

 

02基于縱向觀察性數(shù)據(jù)的上市后藥品安全監(jiān)測

 

應用于上市后藥品安全監(jiān)測的數(shù)據(jù)還有EHR 和保險索賠數(shù)據(jù),其特點是能夠獲得基于個體水平的縱向觀察記錄,能夠掌握總體用藥人群信息,彌補SRS 的缺陷[5]。

 

2.1 比值失衡分析法

 

比值失衡分析法同樣可以應用于縱向觀察性數(shù)據(jù),但此時構(gòu)建2×2 四格表的方式與SRS 存在差異。Zorych 等[5] 提出了3種四格表構(gòu)建方法:①基于患者法:根據(jù)每個患者用藥和不良事件發(fā)生情況對其進行分組,使得最終四格表的總計為數(shù)據(jù)庫中的患者總數(shù);②模擬SRS 法:類似SRS 的模式(表1),只保留用藥且出現(xiàn)不良事件的患者,每個患者可貢獻多條記錄,最終四格表的總計不一定等于患者總數(shù);③改良SRS 法:結(jié)合了縱向觀察性數(shù)據(jù)的特點, 考慮了使用藥品但未出現(xiàn)不良事件的情況,即無事件暴露(event-free exposure)和出現(xiàn)不良事件但未使用藥品的情況,即無暴露事件(exposure-free event)。無事件暴露和無暴露事件不會出現(xiàn)在傳統(tǒng)的SRS 數(shù)據(jù)中,改良SRS法利用縱向觀察性數(shù)據(jù)中對患者長期隨訪所得到的信息豐富的優(yōu)勢,將無事件暴露和無暴露事件記錄入2×2 四格表(表3)。其中,無事件暴露的患者用藥情況會被記錄入表3 的B 格或者D 格;無暴露事件會被記錄入C 格。此外,比值失衡分析法還可對是否只納入首發(fā)不良事件進行限定[5]。當同一患者服藥期間首發(fā)和復發(fā)的不良事件對于安全信號的衡量均重要時,應同時考慮非首發(fā)不良事件。

 

縱向觀察性數(shù)據(jù)的比值失衡分析法的假設檢驗同樣可分為頻數(shù)學派和貝葉斯學派2 種方法。Zorych 等[5] 將上述四格表構(gòu)建方法與是否限制首發(fā)不良事件進行了方法上的排列組合,并利用Thomson Reuters 數(shù)據(jù)庫進行了不同方法組合的模擬分析和實例驗證。結(jié)果顯示,模擬SRS 法和改良SRS 法的表現(xiàn)優(yōu)于基于患者的四格表構(gòu)建方法,而是否只納入首發(fā)不良事件對結(jié)果影響不大。此外,貝葉斯學派方法的穩(wěn)健性和準確性依舊優(yōu)于頻數(shù)學派。

 

Schuemie 等[14] 進一步對GPS 法進行了改良,提出縱向伽馬泊松壓縮法(Longitudinal Gamma Poisson Shrinker,LGPS)。LGPS 法在計算藥品- 不良事件組合的期望發(fā)生數(shù)時結(jié)合了暴露信息,即先將未用藥人群發(fā)生的不良事件數(shù)除以未用藥人群的總觀察時間,以此作為不良事件的背景發(fā)生率,之后將其乘以用藥人群的總暴露時長, 作為該組合的期望發(fā)生數(shù)。由于LGPS 法利用了數(shù)據(jù)庫中的暴露信息,故能夠?qū)︼L險進行估計,發(fā)揮了縱向觀察性數(shù)據(jù)的優(yōu)勢[15]。此外,Schuemie等[14] 還利用觀察性醫(yī)療結(jié)果合作組織(Observational Medical Outcomes Partnership ,OMOP)的模擬數(shù)據(jù)庫對LGPS法、基于患者的GPS 法、模擬SRS-GPS 法和改良SRSGPS法4 種方法進行了比較。結(jié)果顯示,LGPS 法在信號檢測方面的穩(wěn)健性和準確性(即對假陰性和假陽性的控制上)優(yōu)于其他3 種方法。

 

為了進一步減少原始反應偏倚(protopathic bias) 導致的假陽性信號,Schuemie 等[14]又提出了藥品相關(guān)不良事件縱向觀察評估法(Longitudinal Evaluation of Observational Profiles of Adverse Events Related to Drugs,LEOPARD)。原始反應偏倚是指某些藥品可用于治療一些疾病引起的癥狀,但該疾病在用藥時并未得到診斷,從而錯誤地得出藥品與疾病之間存在關(guān)聯(lián)的結(jié)論。例如,鎮(zhèn)痛藥會在癌癥診斷前使用,但不能得出鎮(zhèn)痛藥的使用與癌癥有關(guān)[16]。LEOPARD 法首先通過圖示法對檢測出的信號是否受到原始反應偏倚的影響進行檢查,以開始用藥至出現(xiàn)不良事件的時間為橫坐標、累計分布百分比為縱坐標(圖1)[14]。若用藥在不良事件發(fā)生前的比例低于不良事件發(fā)生后,則表明信號可能受到原始反應偏倚的影響(如圖1 中的綠線);若用藥相對于不良事件的發(fā)生呈對角線分布,則表明這個信號可能受到某些混雜因素的影響,需要進一步驗證(如圖1 中的藍線);若用藥在不良事件發(fā)生前的比例高于不良事件發(fā)生后,則提示這個信號可能是真實的安全信號,但仍需后續(xù)研究驗證(如圖1 中的紅線)。具體的假設檢驗方法有單側(cè)二項檢驗法和反LGPS 值法:單側(cè)二項檢驗法可檢驗不良事件后窗口期內(nèi)的處方數(shù)量是否顯著大于不良事件前,如果P 值小于預先設定閾值,則任務存在顯著的原始反應偏倚。反LGPS 值法首先對開始用藥至出現(xiàn)不良事件的時間取相反數(shù),并重新計算反LGPS 值,若其大于原始LGPS 值, 則提示信號可能受到偏倚的影響[14]。Schuemie 等[17] 評估了不同統(tǒng)計分析方法用于EHR 的表現(xiàn)。結(jié)果顯示,將LEOPARD 法作為其他方法的陽性信號過濾器,即在得到陽性信號后使用LEOPARD 法檢測是否存在原始反應偏倚導致的假陽性信號,若存在則將這個陽性信號去除,能夠提高安全信號檢測的整體表現(xiàn),但該方法有時也會錯誤地將某些已知的不良事件歸因于受到原始反應偏倚的影響。

 

利用真實世界數(shù)據(jù)的上市后藥品安全監(jiān)測的統(tǒng)計學方法綜述

 

2.2 處方時序?qū)ΨQ分析法(Sequence Symmetry Analysis, SSA)

 

1988 年,Petri 首先提出處方時序分析的概念[18]。1998年,Hallas 進一步對SSA 進行了闡述,并首次使用該方法分析了心血管藥物引起抑郁癥的安全信號[19]。

 

SSA 的基本假設是:若目標藥品與某一不良事件存在因果關(guān)聯(lián),且該不良事件需要通過另一種指示藥品來治療,那么將會出現(xiàn)使用目標藥品后指示藥品的處方數(shù)量增多的現(xiàn)象,即處方時序為目標藥品→指示藥品的患者數(shù)量將多于處方時序為指示藥品→目標藥品的患者,時序分布不對稱。SSA 一般與自身對照設計相結(jié)合,納入分析的研究對象應同時有目標藥品和指示藥品的使用,以便根據(jù)患者目標藥品和指示藥品的處方時序判定患者的類型[19]。SSA 的假設檢驗基于時序比(sequence ratio,SR), 即正反處方時序數(shù)量之比[19-20]。但考慮到指示藥品的使用可能受到其他因素(如醫(yī)保報銷政策改變)的影響而出現(xiàn)自然增長的情況,因此需要通過校正系數(shù)對原始時序比(crude sequence ratio)進行校正并得到經(jīng)校正的時序比(adjusted sequence ratio,aSR)。此處的校正系數(shù)為零效應時序比(null-effect sequence ratio),即在藥品與不良事件間不存在因果關(guān)聯(lián)的零假設下的期望時序比,代表了背景人群的處方時序信息[19-21]。SSA 的一大優(yōu)勢是能夠?qū)︼L險進行估計,相對應的風險估計值就是時序比。若校正后時序比的95% 可信區(qū)間的下限大于1,則意味著出現(xiàn)一個安全信號[15]。此外,由于采用了自身對照設計,SSA 能夠較好地控制那些不隨時間變化的混雜因素(如性別),但并不能控制其他隨時間變化的因素(如個體臨床嚴重程度)[20]。

 

由于SSA 的原理簡單、易懂,并且最少只需研究對象識別碼、處方編碼和處方時間3 個變量信息即可進行分析[20],許多研究采用SSA 對藥品安全信號進行檢測。Tsiropoulos 等[21] 通過使用SSA 和歐登塞大學藥物流行病學數(shù)據(jù)庫(Odense University Pharmacoepidemiological Database,OPED) 對抗癲癇藥相關(guān)的安全信號進行了檢測。OPED 是一個基于人群的處方數(shù)據(jù)庫,來源于醫(yī)保報銷數(shù)據(jù),覆蓋了丹麥菲英島1990 年8 月至2006 年12 月的相關(guān)處方數(shù)據(jù)。Tsiropoulos 等[21] 在分析過程中使用的變量包括研究對象識別碼、年齡、性別、處方日期、處方商品名、使用方法、計量單位、解剖學治療學及化學分類系統(tǒng)(anatomical therapeutic chemical,ATC) 編碼以及限定日計量(defined daily dose,DDD)。此外,還將抗癲癇藥使用者限定為研究期間初次用藥患者(incident users)。具體操作方式是設定一個為期14 個月的磨合期,即只將數(shù)據(jù)庫中1992年10 月之后的抗癲癇藥使用者納入分析。研究最終檢測出一些先前未知的抗癲癇藥安全信號,如托吡酯與多巴胺類藥物(aSR :10.4,95%CI :1.5~448), 需要進入下一步的驗證。除此之外,SSA 還用于與下尿路癥狀[22]、青光眼[23]、心衰[24] 等不良事件相關(guān)的藥品安全信號檢測。除安全信號的檢測外,SSA 還可以對可疑安全信號進行驗證和風險評估。例如,估計服用心血管藥物后引發(fā)抑郁癥的風險(鈣通道阻滯劑的aSR :1.31,95%CI :1.14~1.51)[19]、服用他汀類藥物后引發(fā)下尿路感染(aSR :1.17,95%CI :1.05~1.30)[25]、睡眠障礙(aSR :1.18,95%CI :1.11~1.25)[26] 以及惡性腫瘤(如胰腺癌aSR :1.31,95% CI :1.13~1.53)[27] 等不良事件的風險。

 

2.3 似然比檢驗分析法(Likelihood Ratio Test,LRT)

 

LRT 也可以用于藥品安全信號的檢測,其統(tǒng)計量為藥品- 不良事件組合的最大對數(shù)似然比值,該比值的分子和分母分別為備擇假設和零假設條件下樣本的最大似然估計值。最大似然估計值的計算一般基于藥品- 不良事件組合的發(fā)生數(shù)服從Poisson 分布或者Binominal 分布的假設[28-29]。假設檢驗方面,若藥品和不良事件無因果關(guān)聯(lián),二者的最大對數(shù)似然比值將出現(xiàn)在1 周圍,但當二者的比值大于1 且超過事先設定的閾值時,則可以認為出現(xiàn)信號?;诹慵僭O下樣本服從條件多項式分布,LRT 采用蒙特卡洛法生成若干隨機樣本,并根據(jù)事先設定的第一類錯誤大小最終確定信號閾值。具體來說,首先通過蒙特卡洛法隨機產(chǎn)生1000 個樣本,而后對這1000 個隨機模擬樣本的最大對數(shù)似然比值進行排序,若第一類錯誤設定在0.05,那么由大到小的第50 [1000×(1-5%)] 個最大對數(shù)似然比值就是信號閾值。所有對數(shù)似然比值大于閾值的藥品- 不良事件組合均可視為安全信號,通過模擬生成的經(jīng)驗分布來確定閾值的方式不會造成第一類錯誤的膨脹。值得注意的是,LRT 可以與α 消耗函數(shù)相結(jié)合,進行幾乎實時的連續(xù)監(jiān)測的同時,也保證了第一類錯誤的控制。此外,LRT 還可以通過分層計算期望的方式對協(xié)變量進行調(diào)整[28-29]。

 

縱向觀察性數(shù)據(jù)在使用LRT時需要利用暴露信息計算對數(shù)似然比值,此時LRT 也稱為縱向似然比檢驗分析法(Longitudinal Likelihood Ratio Test, Long-LRT)[29]。暴露時間根據(jù)是否區(qū)分首發(fā)和復發(fā)的不良事件可分為三類:① 基于事件的暴露時間(event-time):即不區(qū)分首發(fā)和復發(fā)不良事件,對于每個不良事件,其暴露時間為開始用藥至出現(xiàn)不良事件的時間;②基于人時的暴露時間(person-time):即只考慮首發(fā)不良事件,其暴露時間為開始用藥至第一次出現(xiàn)不良事件的時間;③基于藥物暴露的暴露時間(exposure-time):即考慮復發(fā)不良事件,對于每個患者發(fā)生的所有不良事件(包括首發(fā)和所有復發(fā)不良事件)而言,其共享同一個暴露時間(即每個患者各自從開始用藥至結(jié)束用藥的時間)[29]。

 

面對不同的安全信號檢測問題,需要選擇相應的暴露時間,具體情況可分為:①基于藥品:比較不同不良事件的發(fā)生情況,須使用基于事件的暴露時間;②基于不良事件(只考慮首發(fā)不良事件):比較不同藥品的使用情況,須使用基于人時的暴露時間;③基于不良事件(包括復發(fā)事件):比較不同藥品的使用情況,須使用基于藥物暴露的暴露時間[29]。Huang 等[29] 使用以上3 種暴露時間,利用多個臨床試驗的集合數(shù)據(jù)庫,對治療骨質(zhì)疏松藥品合并使用質(zhì)子泵抑制劑時的安全信號進行檢測。結(jié)果顯示,LRT在準實時性監(jiān)測的過程中具有較好的統(tǒng)計效果和第一類錯誤控制效果。

 

除縱向觀察性數(shù)據(jù)外,LRT還可用于SRS,此時對數(shù)似然比值的計算基于前述2×2 四格表(表1),但相關(guān)計算并不涉及暴露時間(或者可以近似看作是每個患者的暴露時間相等)[28]。Huang 等[28] 利用LRT 對FDA藥品不良反應報告系統(tǒng)中孟魯司特在自殺行為以及行為改變方面的不良事件信號以及2004~2008年與肝素使用相關(guān)的安全信號進行檢測。結(jié)果表明,當LRT 用于樣本量較大的SRS 時的統(tǒng)計效能低于比例報告比法和BCPNN 法,但其控制第一類錯誤和錯誤發(fā)現(xiàn)率(false detection rate) 的表現(xiàn)較好。

 

03連續(xù)監(jiān)測:序貫概率比檢驗法(Sequential Probability Ratio Test,SPRT)

 

雖然縱向似然比檢驗分析法也可用于連續(xù)監(jiān)測, 但目前SPRT 仍是處理連續(xù)監(jiān)測問題的主要統(tǒng)計分析方法。此外,SPRT 還可以在對藥品與不良事件關(guān)聯(lián)進行連續(xù)實時監(jiān)測的同時控制第一類錯誤[30]。常見的SPRT 包括MaxSPRT 和條件MaxSPRT(CMaxSPRT)。MaxSPRT 和CMaxSPRT 的核心在于連續(xù)地進行觀察與期望分析(observed and expected analysis)來生成信號,通過對比對數(shù)似然比值和閾值來比較觀察事件數(shù)和期望事件數(shù),當觀察事件數(shù)超過期望事件數(shù)時,一個潛在的安全信號就產(chǎn)生了[30]。

 

3.1 MaxSPRT

 

當從歷史數(shù)據(jù)中獲得足夠多的信息來支持一個期望事件數(shù)時,會采用基于Poisson 分布的MaxSPRT。在Poisson 分布假設下,可以從歷史數(shù)據(jù)中得到基線風險函數(shù),即在零假設下,當藥品與不良事件沒有關(guān)聯(lián)時,給定總暴露人時后預期會觀察到的不良事件數(shù)。此處的總暴露人時是指數(shù)據(jù)中所有個體暴露人時的總和,所以基線風險函數(shù)是一個關(guān)于時間的函數(shù)。除了基線風險函數(shù)以外,MaxSPRT 的實施還需要一個預先設定的上界值。上界值是在零假設下的期望事件的累積數(shù),反映的是監(jiān)測的時長。當基線風險函數(shù)高過上界值,即表示經(jīng)過足夠長時間的事件積累,觀察到的事件積累與原假設下的積累事件數(shù)沒有差異,無法拒絕原假設,檢測會停止。在給定上界值和第一類錯誤α 后,可以通過蒙特卡洛模擬或者查表的方式得到不同第一類錯誤下的閾值。通過連續(xù)地比較觀察到的對數(shù)似然比值和閾值,進行安全信號監(jiān)測[30]。

 

MaxSPRT 已被廣泛應用到疫苗檢測領(lǐng)域,如英國的黃卡計劃(Yellow Card Scheme)。MHRA 采用MaxSPRT 進行人乳頭瘤病毒(Human Papilloma Virus,HPV)疫苗的上市后安全監(jiān)測。Donegan 等[31] 詳細描述了HPV 疫苗上市后在12~18 歲女性中慢性疲勞綜合征(Chronic Fatigue Syndrome,CFS) 信號監(jiān)測中MaxSPRT 的應用。該項目進行了近乎實時的觀察與期望分析,比較了通過黃卡計劃提交的慢性疲勞綜合征報告的數(shù)量(即觀察值)和從英國臨床實踐研究數(shù)據(jù)鏈(Clinical Practice Research Datalink,CPRD)中計算出的用于計算期望值的背景率。通常所有疫苗接種者的暴露時長是假定相同的,在這個假定下,基線風險函數(shù)作為時間的函數(shù)等價于疫苗接種人次的函數(shù),于是通過CPRD 中12~18 歲女性慢性疲勞綜合征的背景發(fā)生率可以得到基線風險函數(shù),基于固定的基線風險函數(shù),從黃卡計劃中任意一時刻所累積的疫苗接種人次計算得到慢性疲勞綜合征的期望事件數(shù),并與當前觀察事件數(shù)比較,以此實施MaxSPRT 的連續(xù)檢測[31]。但是黃卡計劃作為被動SRS,存在報告率偏低的問題,因此在實施MaxSPRT 的時候,會假設不同級別的報告率分別進行信號檢測。當假設報告率> 25% 時,沒有發(fā)現(xiàn)慢性疲勞綜合征信號;當假設報告率≤ 10%時,檢驗提示出現(xiàn)信號[31]。盡管報告率的確切數(shù)值無法被驗證,但鑒于以下3 個原因:①該HPV 疫苗產(chǎn)品附帶黑三角標識(表示該新藥/ 疫苗正在進行集中監(jiān)測以確保及時發(fā)現(xiàn)新的安全隱患);②英國人類藥物委員會(Commissionon Human Medicines,CHM)和MHRA 鼓勵報告所有新藥/ 疫苗的可疑反應[32] ;③ MHRA 在該項目前期發(fā)布了指南來鼓勵不良事件的報告,MHRA 認為預期的報告率應當高于10%,即基于MaxSPRT 的連續(xù)監(jiān)測沒有發(fā)現(xiàn)慢性疲勞綜合征信號。該HPV 疫苗強化藥物警戒計劃的成功實施提供了直接的證據(jù),即接種HPV疫苗與慢性疲勞綜合征風險增加之間沒有關(guān)聯(lián),這一點在后續(xù)更全面的流行病學研究中也得到了進一步證明。

 

此外,MaxSPRT 還被應用于黃卡計劃中新型冠狀病毒疫苗[33]、流感疫苗等多種疫苗的上市后安全監(jiān)測,以及美國疫苗安全數(shù)據(jù)鏈(Vaccine Safety Datalink,VSD)中各類疫苗的上市后安全監(jiān)測。

 

3.2 CMaxSPRT

 

在實踐中,基線風險函數(shù)通常是根據(jù)監(jiān)測開始前在未接觸疫苗或目標藥品的隊列受試者中收集的歷史數(shù)據(jù)估計的。例如,“3.1 MaxSPRT”中的實例使用了CPRD 慢性疲勞綜合征的歷史數(shù)據(jù)。CPRD 擁有英國最新的人口統(tǒng)計、臨床、處方和轉(zhuǎn)診數(shù)據(jù)。這些數(shù)據(jù)提取自全英國350 多萬條EHR,有1250 多萬患者的歷史數(shù)據(jù)。CPRD 研究小組會評估提取數(shù)據(jù)的質(zhì)量和完整性,并且只納入可接受的患者數(shù)據(jù)及臨床操作符合標準的醫(yī)生數(shù)據(jù)作為流行病學研究基礎。

 

然而在很多其他研究中,可及的高質(zhì)量歷史數(shù)據(jù)可能樣本量較小, 或者研究者所關(guān)心的不良事件本身發(fā)生率很低, 此時MaxSPRT 可能會出現(xiàn)偏倚和第一類錯誤膨脹。Li 等[34] 通過模擬的方式,展現(xiàn)了當歷史數(shù)據(jù)中的不良事件數(shù)小于預先設定的上界值的5 倍時,MaxSPRT 會出現(xiàn)較為嚴重的第一類錯誤膨脹問題[34]。MaxSPRT 沒有考慮基線風險函數(shù)估計的隨機性,因此當歷史數(shù)據(jù)沒有包含足夠的信息時,對預期值估計的變異性就會增大。為了解決這個變異性導致的第一類錯誤膨脹問題,Li 等[34]提出CMaxSPRT,該方法不再需要基線風險函數(shù),取而代之的是同時考慮歷史人群和監(jiān)測人群的隨機性。CMaxSPRT 將從歷史人群數(shù)據(jù)和監(jiān)測人群數(shù)據(jù)中分別觀察到的不良事件數(shù)作為條件,即看作不變的常數(shù),把觀察到的這些不良事件數(shù)所需要累計的人時作為隨機變量。簡單地比較2 種人群的不良事件發(fā)生率,如果不良事件在監(jiān)測人群中發(fā)生的速度比歷史數(shù)據(jù)中快得多,那么藥品有可能存在額外的風險。與MaxSPRT 類似,CMaxSPRT的實施除了需要指定第一類錯誤α 以外, 還需要一個預先設定的不良事件數(shù)上界值,當監(jiān)測人群中觀察到的不良事件數(shù)超過上界值且依舊沒有觀察到信號時,監(jiān)測會停止。值得注意的是,CMaxSPRT 中的上界值是研究者預先指定的一個不良事件數(shù),內(nèi)在比較的是該不良事件數(shù)所需要的累計人時與歷史數(shù)據(jù)的對比;而MaxSPRT 中的上界值實則反映的是監(jiān)測時長,體現(xiàn)在零假設下所對應的不良事件數(shù)[34]。

 

CMaxSPRT 目前被美國疫苗安全數(shù)據(jù)鏈項目[35-36] 用于研究HPV 疫苗上市后在9~18 歲(不包含18 歲)亞群和18~27 歲(不包含27 歲)成年亞群中的不良事件,該項目由7 個大型健康計劃與美國疾病控制中心合作開展,于2006 年8 月20 日開始,一直持續(xù)到2009 年9 月[37]。Li 等[34]使用2006~2008 年的監(jiān)測數(shù)據(jù)報告了在成年亞群中過敏反應的初步結(jié)果。該項目的歷史對照組由美國疫苗安全數(shù)據(jù)鏈資料中接受百日咳混合疫苗、破傷風和白喉疫苗、Menactra 疫苗( 一種預防腦膜炎球菌病的疫苗)或水痘疫苗的數(shù)據(jù)組成。2000 年1 月~2006 年6 月,共接種疫苗67 511 次,發(fā)生過敏反應14 次。在預先指定的MaxSPRT 上界值為40 的情況下,MaxSPRT 在第60 周生成唯一信號,檢驗統(tǒng)計量略大于閾值(圖2)。歷史數(shù)據(jù)中的不良事件數(shù)14 與上界值40之比0.35 遠小于基于模擬得到的常用閾值5,在這種情況下,由于沒有考慮到在估計基線風險函數(shù)時的隨機性,使用MaxSPRT導致假陽性被放大。如果采用CMaxSPRT,因其考慮了期望值和觀察值的隨機性,在整個監(jiān)測期間,檢驗統(tǒng)計量始終維持在一個很小的水平,零假設從未被拒絕[34]。

 

利用真實世界數(shù)據(jù)的上市后藥品安全監(jiān)測的統(tǒng)計學方法綜述

 

3.3 MaxSPRT 和CMaxSPRT 方法在實踐中的挑戰(zhàn)

 

MaxSPRT 和CMaxSPRT在疫苗上市后連續(xù)監(jiān)測領(lǐng)域的廣泛使用得益于以下兩點:①在處理疫苗暴露時長時,可以依據(jù)疫苗固定的給藥次數(shù)假設每個個體的疫苗暴露時長是相等的。累計暴露人時即可被簡化成疫苗接種人次的累加。僅僅需要疫苗接種人次的數(shù)據(jù)統(tǒng)計, 即可實施MaxSPRT 和CMaxSPRT。②疫苗項目多在健康人群或某一年齡段(性別)的人群中開展,人群異質(zhì)性較小,樣本量較大,即使存在混雜因素,通過簡單的分層(如年齡、性別)可以較好地控制混雜因素。然而在其他藥品上市后連續(xù)監(jiān)測中,如抗腫瘤藥物或慢性病藥物,每個個體的藥物暴露時長差別大、個體之間異質(zhì)性大、樣本量相對小等因素,MaxSPRT 和CMaxSPRT 使用受到限制。

 

借力真實世界數(shù)據(jù),可以突破以上挑戰(zhàn), 將MaxSPRT 和CMaxSPRT 推廣到更多的疾病或藥品領(lǐng)域。Shin 等[1] 鑒于SRS 數(shù)據(jù)不良事件定義明確但報告率低、個體基線信息和暴露時長信息不完善,而大型EHR 或保險索賠的真實世界數(shù)據(jù)含有更豐富的基線信息和藥物暴露時間信息但對不良事件定義不明的現(xiàn)狀,建議建立藥物警戒專用數(shù)據(jù)處理管道(pharmacovigilance specialized data proces spipeline),將不同數(shù)據(jù)源的安全性數(shù)據(jù)分別轉(zhuǎn)換到相同的觀察性醫(yī)療結(jié)果合作組織通用數(shù)據(jù)模型,并通過薈萃分析、整合分析從不同數(shù)據(jù)源得到的結(jié)果,以生成藥品安全性的真實世界證據(jù)。為了結(jié)合不同類型數(shù)據(jù)的長處,類似的思路也可用于MaxSPRT 和CMaxSPRT 的應用。利用通用數(shù)據(jù)模型將不同數(shù)據(jù)源進行預處理整合, 再利用混合Poisson分布或者其他分布衍生出適用于多數(shù)據(jù)源的MaxSPRT 和CMaxSPRT,并利用蒙特卡洛模擬計算相對應的閾值。

 

04討  論

 

除了SRS 數(shù)據(jù)源, 其余的真實世界數(shù)據(jù)在上市后安全監(jiān)測上的使用均屬于數(shù)據(jù)的二次使用,即數(shù)據(jù)源本身并非是以上市后安全監(jiān)測為目的設計的。在二次使用這些數(shù)據(jù)時,需要特別關(guān)注數(shù)據(jù)本身特點與研究問題的特征,以及數(shù)據(jù)源與研究問題之間的相關(guān)性[38]。在二次使用數(shù)據(jù)源時需要注意以下幾點:①數(shù)據(jù)采集的完整性,如數(shù)據(jù)庫是否可信地采集了患者所有的健康記錄,數(shù)據(jù)庫的覆蓋性、信息完整性、時間長度等方面是否有明顯缺欠;②通過數(shù)據(jù)庫評價藥物暴露時帶來的偏倚;③通過數(shù)據(jù)庫定義結(jié)局時的有效性;④數(shù)據(jù)庫彼此之間的不一致性。

 

當二次使用真實世界數(shù)據(jù)進行上市后安全監(jiān)測時,通常不可能進行數(shù)據(jù)驗證和進行完全控制混雜的分析。因此,有必要進行敏感性分析以及安全信號再評估。敏感性分析通常包括增加人群的納入和排除條件限制[39]、增加混雜控制[40]、將結(jié)論與外部數(shù)據(jù)做校準[41] 等。利用已經(jīng)得到驗證的研究方法來控制更多的混雜因素、校準結(jié)局變量或協(xié)變量,可以有效地解釋安全監(jiān)測中得到的假設。例如,通過連續(xù)監(jiān)測,美國疫苗安全數(shù)據(jù)鏈項目發(fā)現(xiàn)了一個麻疹- 腮腺炎- 風疹- 水痘四聯(lián)疫苗和共濟失調(diào)統(tǒng)計意義上顯著相關(guān)的信號,這個初始信號的產(chǎn)生意味著產(chǎn)生了一個麻疹- 腮腺炎- 風疹- 水痘四聯(lián)疫苗可能會導致共濟失調(diào)的假設?;谶@個初始信號,研究者開展了安全信號再評估以對該假設進行驗證。在隨后的數(shù)據(jù)驗證中發(fā)現(xiàn)這是由于某個研究中心將步態(tài)問題錯誤編碼成了共濟失調(diào),真實情況中并不存在共濟失調(diào)的問題,這個假設隨即被推翻了[42]。再如,羅塔泰克(RotaTeq)和胃腸道出血的初始安全信號在仔細調(diào)整年齡、部位和接種周等因素后也消失了[42]。以上例子均說明在初步發(fā)現(xiàn)安全信號之后敏感性分析和再評估的必要性。

 

本文中提到的安全信號檢測方法基于一個常見的假設,即如果藥品與某些不良事件存在因果關(guān)聯(lián),那么該藥品- 不良事件組合的實際發(fā)生數(shù)將超過期望?;谶@個假設,反推如果出現(xiàn)在用藥之后的不良事件超過期望,那么很可能是藥品引起了不良事件。但是,這個邏輯在實踐中并不是一定成立的。即使大量不良事件發(fā)生在用藥之后,某些情況下依舊只能得到相關(guān)性而非因果性的統(tǒng)計結(jié)論。比如,引起某一不良事件的原因并非藥品而是臨床操作,那么也可能觀察到以上的情況。因此,進一步說明了對安全信號再評估的重要性和必要性。

 

除了常見的EHR、保險索賠等真實世界數(shù)據(jù),新一代基于社交媒體的真實世界數(shù)據(jù)具有更好的及時性、更大的信息量等特點, 但同時也存在數(shù)據(jù)質(zhì)量更低、結(jié)構(gòu)更復雜等問題。綜合來看,在上市后安全監(jiān)測中使用這些數(shù)據(jù)具有一定的潛力。近年來,通過使用統(tǒng)計模型、機器學習和深度神經(jīng)網(wǎng)絡架構(gòu)等技術(shù)將社交媒體數(shù)據(jù)應用于上市后安全檢測已經(jīng)取得了進展。在一年一度的健康應用社交媒體挖掘(Social Media Mining for Health Applications)研討會上,研究者提出了一種即使在出現(xiàn)非正式俚語術(shù)語或藥品名稱拼寫錯誤的情況下也能夠以較高的精確度和召回率識別藥物的提取算法[43]。然而,對藥品相關(guān)不良事件的高效識別仍然是一個挑戰(zhàn),因為同一藥品不良反應的文字描述可能在書面描述上存在很大差異,如“胃”可能被表達為“胃痛”“胃疼”“腹痛”“肚子痛”等。此外,對藥品攝入的第一人稱和二級報告進行分類以此來確認社群中與不良事件相關(guān)的人群是另一個挑戰(zhàn)。這一系列文本識別與分類的工作將數(shù)據(jù)源從與患者直接報告或直接相關(guān)的自發(fā)報告數(shù)據(jù)以及EHR或保險數(shù)據(jù)擴展到不與患者直接接觸的社交媒體數(shù)據(jù)成為可能。但是在文本識別與分類之后,還需要將結(jié)構(gòu)化的數(shù)據(jù)進一步處理成真實世界研究或者臨床研究可用的數(shù)據(jù)。開發(fā)一個高建構(gòu)效度、高信度、高反應性和模式間等效性的不良事件詞典是一項重要工作。Basch 等[44] 闡述了針對患者報告結(jié)局的不良事件通用術(shù)語標準的開發(fā)。在利用社交媒體的安全性監(jiān)測中,類似的不良事件通用術(shù)語標準版本的開發(fā)也尤為必要。理想情況下,這些努力最終將使系統(tǒng)能夠主動監(jiān)測社交媒體數(shù)據(jù),并生成與藥物警戒工作相關(guān)的實時統(tǒng)計數(shù)據(jù)以及數(shù)據(jù)庫。

 

分享到:

來源:中國食品藥品監(jiān)管雜志

相關(guān)新聞: