您當(dāng)前的位置:檢測(cè)資訊 > 科研開(kāi)發(fā)
嘉峪檢測(cè)網(wǎng) 2021-09-10 21:15
摘 要 / Abstract
深度學(xué)習(xí)輔助醫(yī)療產(chǎn)品確證性臨床試驗(yàn)的主要評(píng)價(jià)目標(biāo)是輔助臨床醫(yī)療的診斷準(zhǔn)確性和安全性, 多閱片者多病例(MRMC)的研究設(shè)計(jì)是評(píng)價(jià)或比較不同輔助醫(yī)療產(chǎn)品軟件診斷性能的一種方法,可有 效地避免或減少臨床評(píng)價(jià)過(guò)程中因讀片醫(yī)生經(jīng)驗(yàn)或資歷水平等不同以及使用場(chǎng)景等各種差異而產(chǎn)生的偏 倚,從而更加客觀的評(píng)價(jià)試驗(yàn)結(jié)果。本文基于 MRMC 設(shè)計(jì)的特點(diǎn),探討了深度學(xué)習(xí)輔助醫(yī)療產(chǎn)品的臨 床試驗(yàn)設(shè)計(jì)和方法學(xué)思考要點(diǎn),如對(duì)選擇對(duì)照、目標(biāo)疾病診斷金標(biāo)準(zhǔn)、臨床試驗(yàn)類型和評(píng)價(jià)指標(biāo)的考慮;對(duì)檢驗(yàn)假設(shè)建立、病例和閱片者樣本量、病例和閱片者的代表性、閱片過(guò)程隨機(jī)化及對(duì)閱片者培訓(xùn)等的 考慮 ;對(duì)臨床試驗(yàn)過(guò)程中可能產(chǎn)生的各種偏倚的考慮。同時(shí),提出了目前仍面臨的問(wèn)題和難點(diǎn)。建議申 辦方多與方法學(xué)專家和監(jiān)管部門溝通,以期為臨床試驗(yàn)科學(xué)、完善、合理的設(shè)計(jì)和執(zhí)行提供參考。
The main objective of deep learning-assisted confirmatory clinical trials is to evaluate the accuracy and safety of clinical diagnostic products. The multi-reader multi-case (MRMC) research design is a method to evaluate or compare the diagnostic performance of different medical device software, which can effectively avoid or reduce bias in the clinical evaluation process due to differences in the experience or qualification of film readers and different scenario of application and can deliver more objective study results. Based on the characteristics of MRMC design, this paper discusses key considerations of clinical trial design and methodology of deep learning-assisted medical products, including the selection of control, the gold standard of target disease diagnosis, the type of clinical trial and evaluation index, the establishment of test hypothesis, the sample size of cases and readers, the representativeness of cases and readers, the randomization of film reading process, the training for film readers, and consideration of bias in the studies. At the same time, current problems and difficulties are put forward. It is suggested that sponsors communicate with methodology experts and regulators more frequently to facilitate more scientific study design and conduct studies more effectively.
關(guān) 鍵 詞 / Key words
深度學(xué)習(xí) ;人工智能 ;輔助醫(yī)療 ;多閱片者多病例 ;確證性臨床試驗(yàn)
deep learning; artificial intelligence; deep learning-assisted medical device software; multi-reader multi-case; confirmatory clinical trials
以深度學(xué)習(xí)(deep learning) 為 核 心 的 人 工 智 能(artificial intelligence,AI)技術(shù)的興起給 計(jì)算機(jī)圖像識(shí)別、自然語(yǔ)言處理 和語(yǔ)音識(shí)別等領(lǐng)域帶來(lái)了巨大的 技術(shù)突破,這些技術(shù)突破也逐漸 從通用算法研發(fā)拓展到了醫(yī)療、 遙控、自動(dòng)駕駛等各領(lǐng)域?qū)W科場(chǎng) 景中 [1]。以臨床醫(yī)療為例,如通 過(guò)引進(jìn) AI 深度學(xué)習(xí)技術(shù)在內(nèi)的各 種自動(dòng)化工具 ;各領(lǐng)域深度學(xué)習(xí) 研發(fā)輔助決策醫(yī)療器械軟件 ;基于大量的醫(yī)療數(shù)據(jù)信息和各種算 法,為醫(yī)務(wù)人員提供診療活動(dòng)建 議以輔助進(jìn)行臨床決策(如臨床 的輔助篩查、輔助診斷、輔助治 療和輔助結(jié)局預(yù)測(cè))等。
近年來(lái),AI 在我國(guó)輔助治療、 醫(yī)學(xué)影像處理等醫(yī)療器械領(lǐng)域的 應(yīng)用愈發(fā)廣泛,為提高診斷率和 治療有效性做出了重大貢獻(xiàn),已 成為醫(yī)療器械行業(yè)的熱點(diǎn)和焦點(diǎn)。目前,使用傳統(tǒng) AI 技術(shù)的醫(yī)療器 械已有多款產(chǎn)品注冊(cè)上市(如乳腺腫瘤、肺結(jié)節(jié)、結(jié)腸息肉等輔 助識(shí)別軟件),而使用深度學(xué)習(xí)等 新一代 AI 技術(shù)的醫(yī)療器械仍處于 研發(fā)、檢測(cè)、臨床試驗(yàn)階段。從 批準(zhǔn)上市前對(duì)深度學(xué)習(xí)輔助醫(yī)療 器械軟件確認(rèn)的臨床試驗(yàn)角度出 發(fā),考慮到軟件的真實(shí)使用場(chǎng)景 和使用對(duì)象的差異性,國(guó)家藥品 監(jiān)督管理局醫(yī)療器械技術(shù)審評(píng)中 心建議臨床試驗(yàn)采用多閱片者多 病例(multi-reader multi-case, MRMC) 研 究 設(shè) 計(jì) [2]。MRMC研究設(shè)計(jì)是 FDA 推薦的,用于比 較 2 種或多種影像診斷軟件診斷 性能的常用方法,可有效避免臨 床評(píng)價(jià)過(guò)程中因讀片醫(yī)生、使用 場(chǎng)景等各種差異而產(chǎn)生的讀片偏 倚,從而更加客觀的評(píng)價(jià)試驗(yàn)結(jié) 果 [3]。但由于 MRMC 研究設(shè)計(jì)常 需要閱片者分別在不同的閱片模 式下(如單獨(dú)閱片和 AI 輔助閱片) 對(duì)所有入選病例交叉讀片,閱片 結(jié)果可能存在病例與閱片者之間 的多重相關(guān)問(wèn)題,也可能存在試 驗(yàn)結(jié)果和閱片者間潛在的交互作 用。這對(duì)于 MRMC 設(shè)計(jì)的臨床試 驗(yàn)來(lái)說(shuō)不管是研究設(shè)計(jì)、實(shí)施還 是最終統(tǒng)計(jì)分析都比常規(guī)設(shè)計(jì)的 臨床試驗(yàn)更加專業(yè)和復(fù)雜,尤其 是樣本量計(jì)算及對(duì)相關(guān)參數(shù)的合 理假設(shè)。據(jù)此本文從臨床研究方 法學(xué)角度對(duì) MRMC 研究設(shè)計(jì)的相 關(guān)設(shè)計(jì)要點(diǎn)進(jìn)行簡(jiǎn)要介紹,以期 為開(kāi)展深度學(xué)習(xí)輔助醫(yī)療器械軟 件確認(rèn)臨床試驗(yàn)提供支持和參考。
01、研究設(shè)計(jì)方法
AI 輔助醫(yī)療器械確證臨床試 驗(yàn)的目的旨在評(píng)價(jià)目標(biāo)設(shè)備在預(yù) 期使用人群和計(jì)劃使用場(chǎng)景中對(duì) 目標(biāo)疾病篩查、診斷或預(yù)測(cè)等臨 床評(píng)估的安全性和有效性。采用 MRMC 研究設(shè)計(jì)的臨床試驗(yàn)設(shè)計(jì) 分類基本分為以下 3 種 [4]。
①配對(duì)閱片者配對(duì)病例設(shè)計(jì) :全交叉設(shè)計(jì)全部閱片者對(duì)每一種閱 片模式下所有病例的影像數(shù)據(jù)給出 閱片結(jié)果。②非配對(duì)閱片者配對(duì)病 例設(shè)計(jì) :所有病例均提供所有閱片 模式下的影像數(shù)據(jù),部分閱片者只 針對(duì)某一種閱片模式下的影像數(shù)據(jù) 給出閱片結(jié)果,其余閱片者對(duì)另一 種閱片模式下的影像數(shù)據(jù)給出閱片 結(jié)果。③配對(duì)閱片者非配對(duì)病例設(shè) 計(jì) :部分病例提供某一種閱片模式 下的影像數(shù)據(jù),其余病例提供另一 種閱片模式下的影像數(shù)據(jù),全部閱 片者均對(duì)所有病例的影像數(shù)據(jù)給出 閱片結(jié)果。其中,應(yīng)用最多最常見(jiàn) 的是①全交叉配對(duì)設(shè)計(jì),這種設(shè)計(jì) 需要的樣本量相比②③非配對(duì)設(shè)計(jì) 少。如果在某個(gè)前瞻性研究中,無(wú) 法同時(shí)獲取多名臨床醫(yī)生對(duì)同一患 者影像數(shù)據(jù)的閱片結(jié)果或者同一患 者無(wú)法同時(shí)提供所有不同閱片模式 下的影像數(shù)據(jù)時(shí),也可以采用非完 全交叉的研究設(shè)計(jì)方法。
02、評(píng)價(jià)指標(biāo)和研究假設(shè)
MRMC 與新藥和醫(yī)療器械 確證性臨床試驗(yàn)的設(shè)計(jì)思路一致, 主要和次要評(píng)價(jià)指標(biāo)的選擇取決 于目標(biāo)產(chǎn)品的預(yù)期用途,并且評(píng) 價(jià)指標(biāo)應(yīng)該在研究設(shè)計(jì)階段方案 中進(jìn)行明確的定義。
2.1 評(píng)價(jià)指標(biāo)
MRMC 研究設(shè)計(jì)常應(yīng)用于影 像診斷產(chǎn)品的臨床評(píng)價(jià),如 AI 輔 助臨床醫(yī)生對(duì)于肺結(jié)節(jié)的檢出 [5] 或者對(duì)于乳腺癌的篩查診斷 [6],采 用 MRMC 研究設(shè)計(jì)的 AI 輔助醫(yī) 療器械確證臨床試驗(yàn)的評(píng)價(jià)指標(biāo) 多為診斷試驗(yàn)研究的相關(guān)評(píng)價(jià)指 標(biāo)。從診斷產(chǎn)品的性能角度考慮, 受試者工作特征曲線(receiver operating characteristic curve, ROC)曲線下面積(area under curve,AUC)可以綜合所有可 能診斷界值(cut-off value)下 的 靈 敏 度(sensitivity)和 特 異 度(specificity),從整體水平評(píng) 價(jià)及比較不同診斷產(chǎn)品或不同閱 片模式下的診斷效能,通常是被 優(yōu)先考慮的一個(gè)主要指標(biāo)。另一 方面,從臨床實(shí)踐的角度考慮, 針對(duì)有實(shí)際臨床意義或影響臨床 操作的診斷界值,也建議給出此 診斷界值的靈敏度和特異度,以 結(jié)合臨床實(shí)際評(píng)價(jià)新輔助診斷產(chǎn) 品或者影像診斷模式對(duì)疾病或患者診斷的實(shí)際獲益或風(fēng)險(xiǎn),通常 也會(huì)將特定診斷界值下的靈敏度 和特異度作為另外一個(gè)主要指 標(biāo),或者也可以退而求其次將其 定義為次要評(píng)價(jià)指標(biāo)。但需要注 意的是,此處的診斷界值應(yīng)該是 對(duì)應(yīng)有明確臨床意義的界值,而 不是僅通過(guò)分析 ROC 曲線的統(tǒng) 計(jì)方法得到的界值。目前,AI 輔 助醫(yī)療器械除應(yīng)用在病例水平檢 測(cè)外,也有一部分是具體到病變 水平(如結(jié)節(jié)、冠狀動(dòng)脈部位) 給出相應(yīng)的結(jié)果,所以除對(duì)病 例水平的 ROC 分析外,專門針 對(duì)病變水平的無(wú)反應(yīng) ROC 曲線 下 面 積(free-response ROC area under curve,FROCAUC)及在此基礎(chǔ)上做出改進(jìn)的 可 替 代 無(wú) 反 應(yīng) ROC 曲 線 下 面 積(alternative free-response ROC area under curve, AFROC-AUC)也常作為評(píng)價(jià) 指標(biāo) [7-9]。
2.2 假設(shè)檢驗(yàn)
臨床試驗(yàn)評(píng)價(jià)深度學(xué)習(xí)輔助 決策醫(yī)療器械軟件的設(shè)計(jì)多樣, 通常情況下建議選擇同期可比的 對(duì)照進(jìn)行比較研究,如可以選擇 同類儀器或軟件或臨床參考標(biāo)準(zhǔn) 進(jìn)行非劣效比較設(shè)計(jì),也可以選 擇替代方法,如 AI 輔助醫(yī)生聯(lián) 合閱片與醫(yī)生單獨(dú)閱片比較進(jìn)行 優(yōu)效比較設(shè)計(jì) [2]。統(tǒng)計(jì)學(xué)假設(shè)檢 驗(yàn)類型的選擇需要結(jié)合目標(biāo)產(chǎn)品 的臨床預(yù)期、試驗(yàn)的主要目的和 選擇的參考對(duì)照綜合考慮,但 總體來(lái)說(shuō)假設(shè)檢驗(yàn)基本類型與 臨床研究的常見(jiàn)研究假設(shè)一致, 可以分為非劣效性試驗(yàn)(noninferiority trial)、 等 效 性 試 驗(yàn) (equivalencetrial)和優(yōu)效性試 驗(yàn)(superiority trial)[10]。幾種 假設(shè)檢驗(yàn)的具體表述形式見(jiàn)表 1。

申辦者在計(jì)劃開(kāi)展試驗(yàn)時(shí)需 要結(jié)合產(chǎn)品實(shí)際情況選擇合理的 設(shè)計(jì)類型。國(guó)家藥品監(jiān)督管理局 醫(yī)療器械技術(shù)審評(píng)中心也建議優(yōu) 先選擇同品種產(chǎn)品或臨床參考標(biāo) 準(zhǔn)進(jìn)行非劣效對(duì)照設(shè)計(jì),若無(wú)同 品種產(chǎn)品且難以獲取臨床參考標(biāo) 準(zhǔn)可選擇替代方法,如選擇用戶 結(jié)合軟件聯(lián)合決策與用戶單獨(dú)決 策進(jìn)行優(yōu)效對(duì)照設(shè)計(jì) [2]。但是無(wú) 論是哪種設(shè)計(jì),非劣效或優(yōu)效試 驗(yàn)對(duì)界值的確定應(yīng)當(dāng)有充分的臨 床依據(jù)。
03、目標(biāo)疾病診斷金標(biāo)準(zhǔn)
對(duì)于 MRMC 設(shè)計(jì)的臨床試 驗(yàn)來(lái)說(shuō),必須明確針對(duì)研究對(duì)象 目標(biāo)疾病狀態(tài)的診斷金標(biāo)準(zhǔn)。所 謂“ 金 標(biāo) 準(zhǔn) ”(gold standard) 就是目前醫(yī)學(xué)界公認(rèn)的、診斷某 一疾病的最佳方法,如病理檢查、 隨訪診斷或其他檢查手段的檢查 結(jié)果等。對(duì)于深度學(xué)習(xí)輔助決策 醫(yī)療器械軟件或影像診斷等臨床 試驗(yàn)來(lái)說(shuō),會(huì)存在目標(biāo)疾病暫時(shí) 并未有明確的診斷金標(biāo)準(zhǔn)或標(biāo)準(zhǔn) 診斷方法,針對(duì)這種情況基于多 名臨床專家共同讀片的診斷結(jié)果 也可以作為最終評(píng)價(jià)的金標(biāo)準(zhǔn)。
如果采用多名臨床或影像專 家共同讀片的診斷結(jié)果作為金標(biāo) 準(zhǔn),建議在研究方案中對(duì)以下內(nèi) 容進(jìn)行明確 :①專家的數(shù)量。② 專家的專業(yè)、資質(zhì)、知識(shí)水平、 職稱或資歷。③在讀片過(guò)程中為 幫助專家給出相對(duì)準(zhǔn)確的診斷結(jié) 果而提供給專家的關(guān)于研究對(duì)象的具體信息(如年齡、性別和其 他檢查結(jié)果等)。④臨床專家對(duì)于 目標(biāo)疾病定義為陽(yáng)性或者陰性的 明確的判定方法和標(biāo)準(zhǔn)等。需要 注意的是,參與目標(biāo)疾病金標(biāo)準(zhǔn) 診斷結(jié)果的臨床或影像專家與目 標(biāo)產(chǎn)品試驗(yàn)評(píng)價(jià)過(guò)程中的閱片醫(yī) 生必須是完全獨(dú)立的。
04、病例和閱片者數(shù)量
如前所述,在 MRMC 設(shè)計(jì) 的臨床試驗(yàn)中,數(shù)據(jù)變異的來(lái)源 除入組病例間的變異外,閱片者 間的變異性也是一個(gè)主要的影響 因素。在臨床試驗(yàn)設(shè)計(jì)階段尤其 是樣本量估算時(shí),需要綜合考慮 病例間的變異和閱片者間的變異, 分別估計(jì)病例和閱片者兩部分的 樣本數(shù)量。同時(shí),在相同的檢驗(yàn) 假設(shè)條件下采用多數(shù)量的閱片者 也可以在一定程度上減少所需的 病例數(shù)量。
由于 MRMC 設(shè)計(jì)的臨床研 究樣本量計(jì)算推導(dǎo)過(guò)程相對(duì)比 較復(fù)雜且偏數(shù)學(xué)推導(dǎo),后續(xù)本 研究組將專門針對(duì)樣本量的計(jì) 算進(jìn)行闡述,在此不再做詳細(xì) 介紹。但需要明確的是,在臨 床試驗(yàn)設(shè)計(jì)時(shí)需結(jié)合臨床研究 的主要目的,即從統(tǒng)計(jì)學(xué)角度 同時(shí)考慮估計(jì)納入病例和閱片 醫(yī)生兩部分的樣本量。
05、數(shù)據(jù)收集和報(bào)告
MRMC 設(shè)計(jì)的臨床試驗(yàn)中統(tǒng) 計(jì)評(píng)價(jià)指標(biāo)主要是基于 ROC 曲 線計(jì)算得到的 AUC,以及相關(guān) 的 衍 生 指 標(biāo)( 如 FROC-AUC、 AFROC-AUC),也可以是特定 診斷界值下的靈敏度、特異度一 類二分類指標(biāo)。所以,針對(duì)這類 設(shè)計(jì)的研究,以 AI+ 臨床醫(yī)生評(píng) 判和臨床醫(yī)生獨(dú)立評(píng)判為例,需 要收集的數(shù)據(jù)信息除病例和閱片 者的基本信息外,與有效性評(píng)價(jià) 相關(guān)的指標(biāo)主要為病例水平的 金標(biāo)準(zhǔn)診斷結(jié)果(如陽(yáng)性 / 陰性 或病例 / 非病例格式的二分類數(shù) 據(jù))、臨床醫(yī)生獨(dú)立閱片的診斷結(jié) 果和 AI 輔助下臨床醫(yī)生獨(dú)立閱片 的診斷結(jié)果。其中,與 MRMC ROC 分析相對(duì)應(yīng),臨床醫(yī)生獨(dú) 立閱片的評(píng)判結(jié)果和 AI 輔助下臨 床醫(yī)生獨(dú)立閱片的評(píng)判結(jié)果常常 是相對(duì)細(xì)化的置信度評(píng)分,如乳 腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BIRADS) 分 級(jí) 形 式, 即 1~7 級(jí)的等級(jí)計(jì)數(shù)形式或百分 計(jì)數(shù)形式,反映了臨床醫(yī)生對(duì)于 判定陽(yáng)性結(jié)果的把握程度,評(píng)分 越高表示診斷為陽(yáng)性病例的可能 性越大。通常在有些臨床試驗(yàn)中 除細(xì)化的置信度評(píng)分外,臨床醫(yī) 生也可根據(jù)臨床實(shí)際給出一個(gè)二 分類的結(jié)果,用于靈敏度和特異 度等指標(biāo)的計(jì)算。
FDA 給 出 了《 關(guān) 于 診 斷 類 產(chǎn)品評(píng)價(jià)的統(tǒng)計(jì)結(jié)果報(bào)告指南》 (Statistical Guidance on Reporting Results from Studies Evaluating Diagnos Tests)[11],可以為 AI 輔助診斷 臨床試驗(yàn)的統(tǒng)計(jì)結(jié)果報(bào)告提供標(biāo) 準(zhǔn)。針對(duì)MRMC設(shè)計(jì)的臨床試驗(yàn), 參考該指南建議匯報(bào)總體的診斷 效能情況、每位閱片醫(yī)生的診斷 準(zhǔn)確性,以及考慮閱片者、病例 等各種變異下的置信區(qū)間等結(jié)果。
06、MRMC設(shè)計(jì)在臨床試驗(yàn)研究中的偏倚及控制
臨床試驗(yàn)的主要目的是盡量 無(wú)偏倚的評(píng)價(jià)診斷產(chǎn)品的準(zhǔn)確度 或 2 種或 2 種以上不同診斷產(chǎn)品 或診斷模式之間的準(zhǔn)確度差異 [12]。但臨床試驗(yàn)實(shí)際操作過(guò)程中難免 會(huì)引入一些偏倚從而影響試驗(yàn)結(jié) 果的準(zhǔn)確評(píng)價(jià),在采用 MRMC 設(shè)計(jì)的診斷試驗(yàn)準(zhǔn)確度評(píng)價(jià)研究 中最常見(jiàn)的幾種偏倚如下。
(1)選擇偏倚 :入選樣本受 額外因素的影響無(wú)法代表目標(biāo)總 體而引起的偏倚。對(duì) MRMC 設(shè) 計(jì)的臨床研究入選樣本應(yīng)包括入 組病例和入組閱片醫(yī)生兩部分。入組病例應(yīng)包括全面的疾病特征 和信息(如不同分型、不同嚴(yán)重 程度等),入組閱片醫(yī)生也應(yīng)當(dāng)依 據(jù)目標(biāo)產(chǎn)品的預(yù)期使用環(huán)境和使 用對(duì)象選擇與之相匹配的閱片醫(yī) 生(如職稱、資歷、閱片經(jīng)驗(yàn)等), 以保證研究人群的代表性。
(2)證實(shí)偏倚 :陽(yáng)性(或陰 性)試驗(yàn)結(jié)果的患者會(huì)有更多的 機(jī)會(huì)接受金標(biāo)準(zhǔn)的驗(yàn)證,這樣當(dāng) 僅以接受金標(biāo)準(zhǔn)驗(yàn)證的患者進(jìn)行 診斷能力的評(píng)估時(shí)就會(huì)產(chǎn)生證實(shí) 偏倚,尤其是在回顧性收集資料 的研究設(shè)計(jì)中,更應(yīng)該注意盡量 減少這類偏倚,且前瞻性設(shè)計(jì)的 研究也建議盡可能讓全部入組病 例均能接受金標(biāo)準(zhǔn)的驗(yàn)證。
(3)閱片順序偏倚 :在比較 2 種或 2 種以上不同診斷產(chǎn)品或 診斷模式之間的診斷能力時(shí),閱 片醫(yī)生需要分別在不同模式下進(jìn) 行閱片,后一種閱片模式下閱片 醫(yī)生的判讀可能會(huì)受到記憶中前 一閱片模式下的信息干預(yù)而影響 結(jié)果。閱片過(guò)程的隨機(jī)化操作可 有效減少這類偏倚,可以隨機(jī)分 配閱片醫(yī)生的閱片順序,也可以 隨機(jī)分配入組受試者接受時(shí)的閱 片順序。另外,對(duì)于不同診斷產(chǎn) 品或診斷模式間的讀片間隔,建 議設(shè)定至少 4 周的洗脫期,因?yàn)?洗脫期間隔越長(zhǎng)讀片過(guò)程中的記 憶偏倚相對(duì)越小 [3]。另外,為避 免閱片醫(yī)生間由于不同的閱片習(xí) 慣和評(píng)判標(biāo)準(zhǔn)所帶來(lái)的閱片過(guò)程 和評(píng)判結(jié)果的偏倚,研究開(kāi)始前 需要對(duì)閱片者進(jìn)行統(tǒng)一的培訓(xùn), 包括閱片環(huán)境、閱片方法和評(píng)判 結(jié)果的標(biāo)準(zhǔn)化定義等,同時(shí)建議 在方案中明確定義整個(gè)閱片流程、 閱片操作的規(guī)范化和評(píng)判結(jié)果的 標(biāo)準(zhǔn)化。
07、結(jié) 論
在深度學(xué)習(xí)輔助醫(yī)療器械 軟件確認(rèn)的臨床試驗(yàn)中,采用 MRMC 的設(shè)計(jì)方法可以有效地控 制由于閱片醫(yī)生年資、水平和經(jīng) 驗(yàn)等不同和器械軟件使用場(chǎng)景和 目的的不同所帶來(lái)的結(jié)果評(píng)價(jià)的 偏倚,同時(shí)采用多閱片者研究可 以在一定程度上減少需要的入組 病例數(shù),提高試驗(yàn)的把握度。但 是,由于 MRMC 的設(shè)計(jì)引入了 閱片者的因素,使得臨床試驗(yàn)的 研究設(shè)計(jì)和統(tǒng)計(jì)分析變得相對(duì)更 加復(fù)雜,建議申辦方在開(kāi)展類似 的臨床試驗(yàn)時(shí)多與方法學(xué)專家和 相關(guān)監(jiān)管部門溝通,合理設(shè)計(jì)試 驗(yàn)流程和操作、減少試驗(yàn)中的偏 倚,更加客觀和準(zhǔn)確地評(píng)價(jià)臨床 試驗(yàn)的效果。
引用本文
尚美霞,閻小妍,姚晨*,李雪迎,朱賽楠.深度學(xué)習(xí)輔助醫(yī)療產(chǎn)品開(kāi)展確證性臨床試驗(yàn)的多閱片者設(shè)計(jì)和方法學(xué)考慮[J].中國(guó)食品藥品監(jiān)管,2021(7):100-105.
深度學(xué)習(xí)輔助醫(yī)療產(chǎn)品開(kāi)展確證性臨床試驗(yàn)的多閱片者設(shè)計(jì)和方法學(xué)考慮
第一作者簡(jiǎn)介
尚美霞,碩士研究生,北京大學(xué)第 一醫(yī)院醫(yī)學(xué)統(tǒng)計(jì)室,主管技師。專 業(yè)方向 :臨床研究統(tǒng)計(jì)設(shè)計(jì)與分析
通訊作者簡(jiǎn)介
姚晨,教授,衛(wèi)生統(tǒng)計(jì)學(xué)碩士,臨 床研究方法學(xué)博士生導(dǎo)師,北京大 學(xué)第一醫(yī)院醫(yī)學(xué)統(tǒng)計(jì)室主任,北京 大學(xué)臨床研究所副所長(zhǎng)。專業(yè)方向:臨床研究統(tǒng)計(jì)設(shè)計(jì)與分析

來(lái)源:中國(guó)食品藥品監(jiān)管雜志