目的:系統(tǒng)分析病理圖像人工智能分析軟件在醫(yī)療器械注冊檢驗過程中的關鍵技術難點,為產(chǎn)品研發(fā)與注冊申報提供參考。方法:基于《病理圖像人工智能分析軟件臨床評價審評要點》《性能評價審評要點》《人工智能醫(yī)療器械注冊審查指導原則》等現(xiàn)行法規(guī)文件,結合技術審評實踐,從數(shù)據(jù)質量控制、算法驗證、臨床試驗設計、配套設備固定性、算法更新管理等維度進行系統(tǒng)分析。結果:列舉出五大關鍵技術難點,并針對各難點提出相應的技術應對策略。
結論:病理圖像人工智能分析軟件的注冊成功依賴于全流程的質量控制與科學驗證,建議企業(yè)在產(chǎn)品研發(fā)初期即引入法規(guī)導向,建立標準化、可追溯的技術體系。
關鍵詞:病理圖像;人工智能;醫(yī)療器械注冊;臨床評價;算法驗證
1 引言
隨著數(shù)字病理學與人工智能技術的深度融合,病理圖像人工智能分析軟件已成為輔助病理診斷的重要工具。該類產(chǎn)品基于深度學習等算法,對全玻片數(shù)字掃描圖像或顯微鏡圖像進行分割、檢測、分類等分析,為病理醫(yī)師提供決策支持。然而,由于其算法復雜性、數(shù)據(jù)依賴性及臨床高風險性,產(chǎn)品在注冊檢驗過程中面臨諸多技術挑戰(zhàn)。
國家藥品監(jiān)督管理局已發(fā)布多項指導原則,明確了該類產(chǎn)品的技術要求與審評要點。本文旨在系統(tǒng)梳理并深入分析這些技術難點,為企業(yè)研發(fā)與注冊申報提供系統(tǒng)性參考。
2 技術難點分析
2.1 數(shù)據(jù)采集與標注的質量控制
2.1.1 問題描述
病理圖像人工智能分析軟件的算法性能高度依賴于訓練數(shù)據(jù)的質量。數(shù)據(jù)采集環(huán)節(jié)涉及掃描設備、染色流程、樣本來源等多重因素,若控制不當,易引入系統(tǒng)性偏倚。數(shù)據(jù)標注環(huán)節(jié)則面臨標注標準不統(tǒng)一、標注人員經(jīng)驗差異、標注一致性難以保證等問題。
2.1.2 技術要求
根據(jù)《病理圖像人工智能分析軟件性能評價審評要點》,數(shù)據(jù)應來源于不少于3家不同地域的機構,涵蓋多種病理類型、分級、分期。標注人員應為病理醫(yī)師,數(shù)據(jù)需經(jīng)不少于2人標注,并建立仲裁機制。
2.1.3 應對策略
標準化采集流程:制定數(shù)據(jù)采集標準操作規(guī)程,明確設備型號、掃描參數(shù)、染色試劑、樣本保存條件等。
標注規(guī)范與質控:建立標注操作規(guī)范,明確標注人員資質、培訓要求、標注規(guī)則。定期進行標注一致性評估,采用Kappa系數(shù)等指標量化標注質量。
可追溯性管理:記錄數(shù)據(jù)來源、標注人員、標注時間、仲裁過程等信息,確保數(shù)據(jù)全流程可追溯。
2.2 算法訓練與驗證的充分性
2.2.1 問題描述
深度學習算法存在過擬合、欠擬合、泛化能力不足等風險。若訓練數(shù)據(jù)分布不均衡,或訓練集、調優(yōu)集、測試集存在重疊,將導致算法性能評估結果虛高,無法反映真實臨床場景下的表現(xiàn)。
2.2.2 技術要求
《人工智能醫(yī)療器械注冊審查指導原則》要求訓練集、調優(yōu)集、測試集應兩兩無交集,并通過查重驗證。測試集應涵蓋多種疾病構成、人群分布、設備類型等,以評估算法泛化能力。
2.2.3 應對策略
數(shù)據(jù)集科學劃分:基于疾病構成、數(shù)據(jù)來源等因素,采用分層抽樣方法劃分數(shù)據(jù)集。訓練集應保證樣本分布均衡性,測試集應模擬真實臨床分布。
數(shù)據(jù)擴增策略:對訓練集中小樣本類別進行擴增,但需控制擴增倍數(shù),避免引入偏倚。測試集原則上不擴增。
性能評估指標:除敏感性、特異性外,引入ROC曲線、AUC值、混淆矩陣等指標。開展壓力測試與對抗測試,評估算法在極端條件下的表現(xiàn)。
2.3 臨床試驗設計的科學性
2.3.1 問題描述
病理圖像人工智能分析軟件無法采用同品種比對路徑,必須開展臨床試驗。試驗設計需考慮閱片者個體差異、洗脫期控制、病例分布等因素,設計不當將影響結果的有效性與可靠性。
2.3.2 技術要求
《病理圖像人工智能分析軟件臨床評價審評要點》推薦采用多閱片者多病例(MRMC)設計或隨機交叉自身對照設計。臨床參考標準應由不少于3名資深病理醫(yī)師組成的專家組共同判讀確定。
2.3.3 應對策略
試驗設計選擇:MRMC設計可有效控制閱片者差異,適用于多中心研究。隨機交叉自身對照設計適用于單中心研究,但需控制洗脫期(通常不少于2周)。
評價指標設置:主要指標包括陽性一致率、陰性一致率、閱片時間。若以閱片效率為主要目標,需同時保證診斷準確性不劣于對照組。
樣本量估算:基于主要指標、預期效應值、I類錯誤率(α≤0.05)、II類錯誤率(β≤0.2)進行估算。MRMC設計需考慮閱片者數(shù)量、病例數(shù)量、分析方法等因素。
2.4 軟件運行環(huán)境與配套設備的固定性
2.4.1 問題描述
軟件性能高度依賴于圖像采集設備、染色試劑、掃描參數(shù)等配套條件。若配套設備不固定,臨床使用時可能出現(xiàn)性能偏移,影響產(chǎn)品的安全有效性。
2.4.2 技術要求
《病理圖像人工智能分析軟件性能評價審評要點》要求在產(chǎn)品說明書中明確配套使用的檢測試劑、圖像采集設備型號、掃描參數(shù)等,且應與臨床前研究一致。
2.4.3 應對策略
配套設備固定化:在產(chǎn)品技術要求與說明書中明確設備型號、試劑廠家、掃描參數(shù)、圖像質量要求。
兼容性驗證:若支持多設備,需驗證各設備下算法性能的一致性,提供兼容性列表。
變更管理:若設備變更,需評估對算法性能的影響,必要時補充驗證或申請變更注冊。
2.5 算法更新與版本控制
2.5.1 問題描述
人工智能算法具有快速迭代的特性,特別是數(shù)據(jù)驅動型更新頻繁。如何判定更新是否構成重大變更,缺乏量化標準,易導致注冊管理混亂。
2.5.2 技術要求
《人工智能醫(yī)療器械注冊審查指導原則》明確:算法驅動型更新通常屬于重大變更;數(shù)據(jù)驅動型更新若導致算法性能發(fā)生統(tǒng)計學顯著變化,亦屬于重大變更,需申請變更注冊。
2.5.3 應對策略
版本命名規(guī)則:建立清晰的版本命名規(guī)則,區(qū)分重大與輕微更新。例如:主版本號變更表示重大更新,次版本號變更表示輕微更新。
更新后性能評估:基于相同測試集,比較更新前后性能指標。若存在統(tǒng)計學差異,應申報變更。
可追溯性管理:記錄每次更新的原因、內容、驗證結果,納入風險管理與可追溯性分析。
3 討論與建議
3.1 系統(tǒng)性挑戰(zhàn)
病理圖像人工智能分析軟件的注冊檢驗涉及數(shù)據(jù)、算法、臨床、法規(guī)等多維度技術難題,各環(huán)節(jié)相互關聯(lián)、相互影響。數(shù)據(jù)質量直接影響算法性能,算法性能又決定臨床試驗結果,而臨床試驗結果則影響注冊審評結論。因此,企業(yè)需建立全流程的質量管理體系。
3.2 法規(guī)導向的重要性
現(xiàn)行指導原則已為產(chǎn)品研發(fā)與注冊提供了明確的技術路徑。企業(yè)應在產(chǎn)品設計階段即引入法規(guī)導向,避免后期返工。建議設立專門的法規(guī)事務團隊,跟蹤最新政策動態(tài),確保產(chǎn)品符合審評要求。
3.3 技術發(fā)展的適應性
隨著人工智能技術的快速發(fā)展,新算法、新應用場景不斷涌現(xiàn)。審評體系亦在不斷完善,如持續(xù)學習算法、聯(lián)邦學習等新興技術的監(jiān)管要求正在逐步明確。企業(yè)需保持技術敏感度,提前布局合規(guī)性研究。
4 結論
病理圖像人工智能分析軟件的注冊檢驗是一項系統(tǒng)工程,涉及數(shù)據(jù)采集與標注、算法訓練與驗證、臨床試驗設計、配套設備固定性、算法更新管理等五大關鍵技術難點。企業(yè)應:
1.建立標準化數(shù)據(jù)采集與標注流程,確保數(shù)據(jù)質量與可追溯性;
2.科學劃分數(shù)據(jù)集,開展充分算法驗證與壓力測試;
3.合理設計臨床試驗,明確評價指標與樣本量;
4.固定配套設備,驗證兼容性與一致性;
5.建立版本管理與更新評估機制,確保迭代過程合規(guī)可控。
通過系統(tǒng)識別并應對上述技術難點,可有效提升產(chǎn)品的安全有效性與注冊成功率。
參考文獻
[1] 國家藥品監(jiān)督管理局醫(yī)療器械技術審評中心. 病理圖像人工智能分析軟件臨床評價審評要點[EB/OL]. (2023-07-10).
[2] 國家藥品監(jiān)督管理局醫(yī)療器械技術審評中心. 病理圖像人工智能分析軟件性能評價審評要點[EB/OL]. (2023-07-10).
[3] 國家藥品監(jiān)督管理局醫(yī)療器械技術審評中心. 人工智能醫(yī)療器械注冊審查指導原則[EB/OL]. (2022-03-07).
[4] 國家藥品監(jiān)督管理局醫(yī)療器械技術審評中心. 醫(yī)療器械軟件注冊審查指導原則(2022年修訂版)[EB/OL]. (2022-03-07).
[5] 原國家食品藥品監(jiān)督管理總局. 醫(yī)療器械臨床試驗設計指導原則[EB/OL]. (2018-01-04).
[6] ZHOU X H, OBUCHOWSKI N A, MCCLISH D K. 診斷醫(yī)學中的統(tǒng)計學方法[M]. 2版. 北京: 高等教育出版社, 2016.
[7] 李衛(wèi). 醫(yī)療器械臨床試驗統(tǒng)計方法[M]. 2版. 北京: 科學出版社, 2016.