隨著真實(shí)世界研究(real-world study,RWS)的提出和實(shí)踐,一系列使用中醫(yī)臨床診療數(shù)據(jù)開展研究并指導(dǎo)臨床實(shí)踐的方法逐步形成,推動了中醫(yī)臨床研究方法學(xué)的發(fā)展。同時,ChatGPT和GPT-4等人工智能(artificial intelligence,AI)技術(shù)的問世,讓更多學(xué)者關(guān)注到基于大數(shù)據(jù)的人工智能技術(shù)對醫(yī)療行業(yè)的影響。
中醫(yī)學(xué)是通過大量臨床實(shí)踐傳承和發(fā)展的學(xué)科,醫(yī)家學(xué)者不斷總結(jié)名老中醫(yī)臨床診療經(jīng)驗(yàn),逐漸形成自身的學(xué)術(shù)觀點(diǎn)、核心處方和用藥特點(diǎn),并在實(shí)踐中進(jìn)一步完善和創(chuàng)新,這種基于“定性”的傳承和發(fā)展模式是目前的主流模式。
隨著研究方法的進(jìn)步、AI技術(shù)的成熟以及多種測量工具的出現(xiàn),以采集中醫(yī)臨床診療數(shù)據(jù),建立研究型數(shù)據(jù)庫,開展真實(shí)世界和人工智能研究,最終指導(dǎo)臨床實(shí)踐的“定量”研究方法將逐步形成,但相關(guān)方法學(xué)仍不完善,主要體現(xiàn)在缺少研究總體設(shè)計(jì)和臨床轉(zhuǎn)化方法等方面。
針對這一問題,有研究者提出了基于中醫(yī)臨床診療數(shù)據(jù)的真實(shí)世界及人工智能研究,并將研究的總體設(shè)計(jì)思路及應(yīng)用方法與大家交流分享。
1、設(shè)計(jì)思路及應(yīng)用方法
1.1建設(shè)高質(zhì)量大樣本的研究型數(shù)據(jù)庫
數(shù)據(jù)庫需基于研究目的、疾病特點(diǎn)進(jìn)行針對性設(shè)計(jì),如中醫(yī)數(shù)據(jù)庫通常需要包含患者的舌脈數(shù)據(jù)。
數(shù)據(jù)庫的高質(zhì)量體現(xiàn)在數(shù)據(jù)的完整性、準(zhǔn)確性、透明性,并在數(shù)據(jù)治理的各個環(huán)節(jié)開展質(zhì)量控制。數(shù)據(jù)缺失難以避免,但可通過數(shù)據(jù)溯源、研究人員培訓(xùn)、患者關(guān)懷等方式,按時定期隨訪,盡可能減少缺失;對于無法避免的缺失可通過統(tǒng)計(jì)方法填補(bǔ)。每一數(shù)據(jù)都應(yīng)有可靠的來源,能夠客觀準(zhǔn)確地記錄患者的真實(shí)情況,不應(yīng)使用隨意復(fù)制的數(shù)據(jù),或未經(jīng)測量隨意填寫的數(shù)據(jù)。研究過程中應(yīng)保留原始數(shù)據(jù),數(shù)據(jù)采集、核查和清洗過程記錄,以及衍生變量的計(jì)算方法等。
數(shù)據(jù)庫的樣本量應(yīng)滿足多種RWS統(tǒng)計(jì)分析及人工智能算法的需要。不同類型的RWS都有各自的樣本量計(jì)算公式,同時還需考慮限制、匹配等方法引起的樣本量減少,以及多因素分析的樣本量要求。深度學(xué)習(xí)算法同樣存在樣本量要求,如神經(jīng)網(wǎng)絡(luò)算法的樣本量不少于輸入層變量數(shù)量的200倍,且樣本量越大,模型越穩(wěn)定。
1.2挖掘及分類核心處方
真實(shí)世界環(huán)境中,不同中藥處方的藥物組成存在差異,為后續(xù)研究帶來困難,因此需對核心處方進(jìn)行挖掘和分類。核心處方的挖掘推薦采用混合研究方法。首先,通過無監(jiān)督學(xué)習(xí)算法探索處方用藥規(guī)律,初步挖掘核心處方。隨后,根據(jù)挖掘結(jié)果,結(jié)合專家訪談、問卷調(diào)查、臨證經(jīng)驗(yàn)梳理等定性研究,明確數(shù)據(jù)庫中的多個核心處方。通常情況下,同一疾病的核心處方可能多達(dá)數(shù)十個。最后,通過相似度匹配算法對真實(shí)世界核心處方進(jìn)行分類,以“類方”的形式開展進(jìn)一步研究。
1.3隊(duì)列研究評價核心處方療效
隊(duì)列研究是RWS中較常見的研究類型,主要用于評價臨床療效和檢驗(yàn)病因假設(shè)。其根據(jù)研究對象是否暴露于某個待研究的危險因素分組,通過對比各組結(jié)局的發(fā)生,推斷暴露因素(治療措施)與疾?。ńY(jié)局)之間的因果關(guān)系。作為隨機(jī)對照試驗(yàn)(RCT)的補(bǔ)充,隊(duì)列研究契合中醫(yī)學(xué)“先臨床后研究”的特點(diǎn),可以使用治理后的臨床診療數(shù)據(jù),快速對多種不同治療措施進(jìn)行療效評價。
需注意的是,混雜因素和偏倚始終是隊(duì)列研究不可忽視的局限性。雖然在研究設(shè)計(jì)、數(shù)據(jù)管理、統(tǒng)計(jì)分析的各個階段都會對偏倚和混雜進(jìn)行控制,但偏倚和混雜始終無法避免。通常情況下隊(duì)列研究更適用于多種中醫(yī)藥治療措施的初步評價,從大量的核心處方、中成藥中快速篩選出可能有效的治療措施。在明確各治療措施的優(yōu)勢人群特征后,仍需要通過RCT進(jìn)一步評價確切療效。
1.4病例對照研究明確優(yōu)勢人群
2012年,劉建平教授與Vinjar F教授提出了中醫(yī)最佳-最差病例的研究思路,并逐漸發(fā)展成為優(yōu)勢人群特征分析。該方法本質(zhì)上屬于病例對照研究,根據(jù)接受指定治療措施后是否發(fā)生某個結(jié)局,將患者分為優(yōu)勢組和劣勢組,通過對比明確使用該治療措施有效的人群特征。有學(xué)者通過病例對照研究,發(fā)現(xiàn)結(jié)直腸癌患者的中醫(yī)優(yōu)勢人群特征為血瘀質(zhì)體質(zhì)的患者,劣勢人群特征為陽虛質(zhì)體質(zhì)或肝脾不和證的患者。優(yōu)勢人群特征分析將成為指導(dǎo)臨床實(shí)踐及精準(zhǔn)醫(yī)療的重要研究方法之一?;趦?yōu)勢人群特征分析結(jié)果,可為RCT提供更加精準(zhǔn)的研究對象篩選標(biāo)準(zhǔn),彌補(bǔ)以往中醫(yī)RCT中因辨證不準(zhǔn)確可能引起的低估藥物真實(shí)療效的問題。
1.5建立預(yù)測模型實(shí)現(xiàn)精準(zhǔn)醫(yī)療
隨著精準(zhǔn)醫(yī)學(xué)發(fā)展,基于臨床診療數(shù)據(jù)預(yù)測治療措施療效的預(yù)測模型被提出,如反事實(shí)預(yù)測模型。該模型是預(yù)后模型的一種,其要點(diǎn)是部分預(yù)測因子是未發(fā)生的事件,即反事實(shí)事件。這類預(yù)測模型可基于中醫(yī)理論構(gòu)建,通過預(yù)測及對比患者在不同用藥方案后的預(yù)后情況,推薦最適宜的用藥方案,為臨床精準(zhǔn)用藥提供參考。
隨著人工智能技術(shù)的發(fā)展,預(yù)測能力更強(qiáng)、可處理復(fù)雜網(wǎng)絡(luò)及多維數(shù)據(jù)的模型及算法逐漸被創(chuàng)造及應(yīng)用。但無論哪種模型或算法被應(yīng)用到中醫(yī)臨床診療中,都應(yīng)遵循中醫(yī)理論框架,符合中醫(yī)臨床思維。例如,將患者主觀感受、舌脈等中醫(yī)診療信息納入模型,實(shí)現(xiàn)結(jié)果的可解釋性。此外,在建立模型后,除了使用驗(yàn)證集對模型開展評價,還需進(jìn)一步開展臨床研究對模型進(jìn)行有效性、安全性及可靠性評價。
2、研究中的挑戰(zhàn)及對策
2.1中醫(yī)變量的采集及數(shù)據(jù)處理
中醫(yī)變量是在中醫(yī)藥理論指導(dǎo)下,可以反映中醫(yī)學(xué)癥狀、體征及內(nèi)在變化規(guī)律等特征的變量,如中醫(yī)體質(zhì)、舌脈、面色、主觀感受等。其中,部分中醫(yī)變量既可以影響中醫(yī)醫(yī)生治療用藥的選擇,又會影響患者的轉(zhuǎn)歸結(jié)局,且不是因果鏈上的中間變量,這些中醫(yī)變量在RWS中屬于混雜因素,在人工智能研究中屬于預(yù)測因子。多數(shù)已發(fā)表的中醫(yī)RWS僅選擇患者生命體征、西藥使用情況和實(shí)驗(yàn)室檢查等西醫(yī)變量作為混雜因素,通常缺少中醫(yī)變量的應(yīng)用;部分研究雖然使用了中醫(yī)變量,但不同研究間對中醫(yī)變量的采集和數(shù)據(jù)處理方法存在差異。
有研究者提出的中醫(yī)主觀表型組學(xué)體系,可通過小程序采集患者的432個生理特征、320個心理特征和267個生活習(xí)慣特征數(shù)據(jù),初步實(shí)現(xiàn)對人體主觀感受的采集。有研究使用智能化設(shè)備采集患者舌診、面診圖像,并通過紅綠藍(lán)(RGB)、色調(diào)-飽和度-亮度(HSV)、亮度-a-b通道(Lab)等不同顏色模型進(jìn)行數(shù)據(jù)處理和圖像顯示,實(shí)現(xiàn)了舌像、面像信息的量化測量。對于脈診數(shù)據(jù),有研究通過壓力感受器繪制脈圖,并基于主波幅度(h1)、主波上1/3處的寬度(w)、脈搏周期(t)、脈搏周期面積(s)等變量處理數(shù)據(jù),初步實(shí)現(xiàn)脈診信息的量化。
目前中醫(yī)變量的采集和數(shù)據(jù)處理方法仍處于探索階段,尚缺少公認(rèn)的標(biāo)準(zhǔn),未來需基于臨床實(shí)踐驗(yàn)證其實(shí)用性及可靠性并予以完善,逐步建立中醫(yī)變量的標(biāo)準(zhǔn)化采集和數(shù)據(jù)處理體系。
2.2混雜因素的確定及測量
中醫(yī)RWS往往需要先建立因果推斷模型證明其確切療效,而混雜因素對療效的因果推斷有著較大的干擾,是觀察性療效比較研究中不可忽視的重要變量。
傾向性評分、疾病風(fēng)險評分法等統(tǒng)計(jì)學(xué)方法常被用于控制混雜,然而確定并選擇混雜因素同樣重要。在觀察不同中醫(yī)治療措施治療相同疾病的療效比較研究中,混雜因素理論上應(yīng)該是一致的,但不同研究選擇的混雜因素通常存在較大差異。
因此,我們可借鑒核心結(jié)局指標(biāo)集的研究思路,根據(jù)不同疾病特點(diǎn),通過文獻(xiàn)檢索、專家訪談、專家共識等方法,明確影響各個疾病療效的主要混雜因素,形成“核心混雜因素集”,并使用有向無環(huán)圖(DAG)客觀反映各混雜因素的關(guān)系,以便于研究人員在相關(guān)疾病的隊(duì)列研究中參考和使用。
此外,還有不少已知但尚無測量方法的混雜因素,例如患者管理策略、護(hù)理水平、醫(yī)生操作手法、醫(yī)生是否對患者進(jìn)行心理疏導(dǎo)等,以及部分未知混雜因素,均會影響最終的療效。已有學(xué)者針對這一問題開展探索,如使用E值評估未知混雜大小。未來可進(jìn)一步設(shè)計(jì)針對性的測量工具,形成標(biāo)準(zhǔn)化的測量方法,并在RWS中探索和應(yīng)用。
2.3方法學(xué)的完善及推廣
目前,中醫(yī)領(lǐng)域真實(shí)世界及人工智能研究的方法學(xué)仍不夠完善,且推廣力度不足。例如,在部分發(fā)表的隊(duì)列研究中,未考慮混雜因素對結(jié)局的影響,或未使用正確的統(tǒng)計(jì)分析方法對混雜因素進(jìn)行控制和處理。建議相關(guān)部門加強(qiáng)對中醫(yī)真實(shí)世界及人工智能方法學(xué)研究的資助力度,實(shí)行鼓勵中文方法學(xué)論文發(fā)表的政策,增加專業(yè)的培訓(xùn)機(jī)構(gòu)和公開課的數(shù)量,以及鼓勵開發(fā)臨床研究輔助軟件,降低方法學(xué)學(xué)習(xí)成本。
2.4跨學(xué)科人才的培養(yǎng)
真實(shí)世界及人工智能研究涉及的學(xué)科較多,包括中醫(yī)類臨床醫(yī)學(xué)、循證醫(yī)學(xué)、流行病學(xué)、信息學(xué)及統(tǒng)計(jì)學(xué)等。為提高研究質(zhì)量,推動成果臨床轉(zhuǎn)化,需要一批既熟悉中醫(yī)臨床思維、了解中醫(yī)診療現(xiàn)狀,又掌握多種研究方法技術(shù)的跨學(xué)科人才。建議在開展相關(guān)研究的同時,注重對青年人才的培養(yǎng),建立完善的跨學(xué)科人才培養(yǎng)機(jī)制,設(shè)立跨學(xué)科人才培養(yǎng)基金,為未來的研究工作做好人才儲備。