您當(dāng)前的位置:檢測(cè)資訊 > 科研開(kāi)發(fā)
嘉峪檢測(cè)網(wǎng) 2024-05-27 13:03
中醫(yī)辨證論治是傳統(tǒng)醫(yī)學(xué)體系的核心,幾千年來(lái)為中華民族的健康發(fā)展發(fā)揮了重要作用。近年來(lái),在多部門(mén)的協(xié)同推進(jìn)下,我國(guó)中醫(yī)科技創(chuàng)新能力持續(xù)提升,中醫(yī)辨證與人工智能、大數(shù)據(jù)等多學(xué)科交叉融合取得一系列新的進(jìn)展,工程化前沿方法和技術(shù)為突破中醫(yī)辨證理論瓶頸提供了有效路徑。
中國(guó)工程院陸軍院士研究團(tuán)隊(duì)在中國(guó)工程院院刊《中國(guó)工程科學(xué)》2024年第2期發(fā)表《人工智能輔助中醫(yī)辨證的關(guān)鍵問(wèn)題與技術(shù)挑戰(zhàn)》一文。文章以新時(shí)代中醫(yī)診斷現(xiàn)代化、智能化發(fā)展為背景,總結(jié)中醫(yī)辨證的基本原理,概括人工智能輔助中醫(yī)辨證的基本過(guò)程以及多模態(tài)數(shù)據(jù)融合、癥狀關(guān)聯(lián)性分析、證候量化、證候推理、中醫(yī)藥大模型等關(guān)鍵問(wèn)題,總結(jié)了每個(gè)環(huán)節(jié)的研究思路和發(fā)展現(xiàn)狀,進(jìn)而根據(jù)現(xiàn)有不足分析當(dāng)前發(fā)展面臨的可利用公開(kāi)數(shù)據(jù)較少且質(zhì)量參差不齊,辨證模型單一、普適性不佳,辨證模型的可解釋性不足且存在差異,辨證模型結(jié)果評(píng)價(jià)存在局限、缺乏可信度等挑戰(zhàn)。文章建議,加強(qiáng)數(shù)據(jù)整合與質(zhì)量把控,深度融合人工智能技術(shù)與中醫(yī)辨證思維、加強(qiáng)模型可解釋性,發(fā)展中醫(yī)藥細(xì)分領(lǐng)域的大語(yǔ)言模型,加強(qiáng)智能中醫(yī)人才隊(duì)伍建設(shè)、鼓勵(lì)多領(lǐng)域?qū)<液献?,完善?guó)際標(biāo)準(zhǔn)和法律法規(guī)、加強(qiáng)國(guó)際合作與交流等,以期為智能中醫(yī)診療的技術(shù)探索和科技創(chuàng)新提供參考。
一、前言
2019年10月,習(xí)近平總書(shū)記對(duì)中醫(yī)藥工作作出重要指示強(qiáng)調(diào),要遵循中醫(yī)藥發(fā)展規(guī)律,傳承精華,守正創(chuàng)新,加快推進(jìn)中醫(yī)藥現(xiàn)代化、產(chǎn)業(yè)化,堅(jiān)持中西醫(yī)并重,推動(dòng)中醫(yī)藥和西醫(yī)藥相互補(bǔ)充、協(xié)調(diào)發(fā)展,推動(dòng)中醫(yī)藥事業(yè)和產(chǎn)業(yè)高質(zhì)量發(fā)展。“十四五”以來(lái),國(guó)家頒布和實(shí)施了一系列關(guān)于促進(jìn)中醫(yī)藥衛(wèi)生事業(yè)發(fā)展的政策與措施,中醫(yī)藥發(fā)展進(jìn)入了新的歷史時(shí)期。2022年,國(guó)務(wù)院辦公廳發(fā)布《“十四五”中醫(yī)藥發(fā)展規(guī)劃》,要求推進(jìn)中醫(yī)藥和現(xiàn)代科學(xué)相結(jié)合,推動(dòng)中醫(yī)藥和西醫(yī)藥相互補(bǔ)充、協(xié)調(diào)發(fā)展,推進(jìn)中醫(yī)藥現(xiàn)代化、產(chǎn)業(yè)化;鼓勵(lì)中醫(yī)辨證論治智能輔助診療系統(tǒng)等具有中醫(yī)特色的信息系統(tǒng)研發(fā)應(yīng)用。2022年,國(guó)家中醫(yī)藥管理局發(fā)布《“十四五”中醫(yī)藥信息化發(fā)展規(guī)劃》,提出開(kāi)展云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能、5G、區(qū)塊鏈、智能感知等新一代信息技術(shù)在中醫(yī)藥領(lǐng)域的集成應(yīng)用研究,探索一批中醫(yī)藥數(shù)字化應(yīng)用場(chǎng)景建設(shè)。黨中央、國(guó)務(wù)院高度重視中醫(yī)藥發(fā)展,將傳承創(chuàng)新發(fā)展中醫(yī)藥定位為新時(shí)代中國(guó)特色社會(huì)主義事業(yè)的重要內(nèi)容。
近年來(lái),人工智能技術(shù)發(fā)展迅猛,并逐步開(kāi)始嵌入到醫(yī)療體系中的多個(gè)環(huán)節(jié),特別是在中醫(yī)診斷領(lǐng)域也表現(xiàn)出了巨大的發(fā)展?jié)摿?。中醫(yī)辨證是中醫(yī)的核心領(lǐng)域。借助于人工智能技術(shù),通過(guò)圖像識(shí)別和深度學(xué)習(xí),可以識(shí)別脈象、舌象、面部色澤、聲音等中醫(yī)診斷要素及微妙變化,幫助醫(yī)生在眾多癥狀和體征中迅速找出關(guān)鍵信息,輔助醫(yī)生做出更精確的判斷,減少誤診和漏診的可能性。人工智能輔助中醫(yī)辨證成為推動(dòng)中醫(yī)診療體系現(xiàn)代化的重要力量。
本文旨在探討人工智能輔助中醫(yī)辨證的基本原理、發(fā)展面臨的關(guān)鍵問(wèn)題,以及實(shí)踐應(yīng)用中面臨的技術(shù)挑戰(zhàn),并提出發(fā)展建議,以期為推動(dòng)人工智能輔助中醫(yī)診療的技術(shù)探索和科技創(chuàng)新提供參考。
二、中醫(yī)辨證的基本原理
(一)傳統(tǒng)中醫(yī)辨證的基本原理
傳統(tǒng)中醫(yī)源于東方傳統(tǒng)哲學(xué)和古代科技文化,經(jīng)過(guò)數(shù)千年的醫(yī)學(xué)實(shí)踐,逐漸形成了其獨(dú)特且完整的理論體系。這一體系不僅為中華民族的健康福祉和民族繁榮作出了貢獻(xiàn),同時(shí)也為世界醫(yī)學(xué)的豐富和發(fā)展提供了寶貴的資源。傳統(tǒng)中醫(yī)的核心理念可以概括為“整體觀念”和“辨證論治”。
“整體觀念”強(qiáng)調(diào)人體是一個(gè)與外部環(huán)境緊密相連的有機(jī)整體,其內(nèi)部各臟腑、經(jīng)絡(luò)、氣血等要素在生理上相互關(guān)聯(lián)、相互制約,共同維持著人體的生命活動(dòng)。當(dāng)人體受到外界致病因素的影響時(shí),這些內(nèi)部要素之間的平衡會(huì)被打破,從而導(dǎo)致疾病的產(chǎn)生。
“辨證論治”則是中醫(yī)診斷疾病的核心原則和方法。在中醫(yī)看來(lái),同一種疾病在不同的患者身上,或者在不同的階段,可能會(huì)表現(xiàn)出不同的癥狀,因此需要根據(jù)患者的具體癥狀、體征、舌象、脈象等信息進(jìn)行綜合分析,以確定疾病的病因、病性、病位等,從而制定出個(gè)性化的治療方案。
傳統(tǒng)中醫(yī)辨證的過(guò)程描述如圖1所示。中醫(yī)的辨證過(guò)程通常包括四診(望、聞、問(wèn)、切)和八綱(陰陽(yáng)、表里、寒熱、虛實(shí))的分析。望診是通過(guò)觀察患者的神、色、形、態(tài)等外在表現(xiàn),以獲取疾病的初步印象;聞診是通過(guò)聽(tīng)患者的聲音、聞其氣味等,以進(jìn)一步了解病情;問(wèn)診是通過(guò)詢問(wèn)患者的病史、癥狀等,以獲取更詳細(xì)的信息;切診則是通過(guò)觸摸患者的脈象,以感受其氣血的流動(dòng)情況。在收集到這些信息后,中醫(yī)醫(yī)師會(huì)根據(jù)所學(xué)知識(shí)和經(jīng)驗(yàn)劃分病域,同時(shí)根據(jù)六經(jīng)分證和八綱辨證理論進(jìn)行分析和歸納,以確定疾病的性質(zhì)、部位和邪正關(guān)系。例如,通過(guò)觀察患者的舌象和脈象,醫(yī)師可以判斷其陰陽(yáng)、表里、寒熱、虛實(shí)等屬性,從而確定疾病的證型。

圖1 傳統(tǒng)中醫(yī)辨證過(guò)程
需注意的是,中醫(yī)的辨證過(guò)程并非完全客觀和可量化,它依賴(lài)于醫(yī)師的感官觀察、經(jīng)驗(yàn)判斷以及患者的主觀感受。這種方法的優(yōu)點(diǎn)是能綜合考慮患者的整體狀況,制定個(gè)性化的治療方案;但缺點(diǎn)也比較明顯,即診斷的準(zhǔn)確性受到醫(yī)師個(gè)人經(jīng)驗(yàn)、技能等因素的影響,且難以進(jìn)行客觀驗(yàn)證和量化評(píng)估。同時(shí),中醫(yī)辨證中的癥狀、癥候、藥量等大多是運(yùn)用自然語(yǔ)言進(jìn)行定性描述,定量計(jì)量和分析不足,因此無(wú)法精確給出大小、程度、數(shù)量等的表達(dá);在癥狀的程度、證候的類(lèi)別、藥物的用量等方面的判斷上,存在模糊性和不確定性等問(wèn)題,進(jìn)而導(dǎo)致功效難以準(zhǔn)確衡量、水平提升緩慢。
盡管如此,中醫(yī)的辨證仍然在全球范圍內(nèi)受到廣泛的關(guān)注和認(rèn)可。隨著現(xiàn)代科技的發(fā)展和進(jìn)步,為了克服上述制約傳統(tǒng)中醫(yī)辨證發(fā)展的因素,需要發(fā)展面向中醫(yī)辨證的人工智能方法,使傳統(tǒng)中醫(yī)辨證方法的不足得到不斷完善。
(二)人工智能輔助中醫(yī)辯證的基本原理
近年來(lái),隨著信息技術(shù)的不斷發(fā)展,人工智能輔助中醫(yī)辨證作為一種新興的現(xiàn)代醫(yī)學(xué)技術(shù)得到了越來(lái)越多的關(guān)注和應(yīng)用。人工智能輔助中醫(yī)辨證將傳統(tǒng)中醫(yī)的辨證理論與現(xiàn)代計(jì)算機(jī)技術(shù)和人工智能技術(shù)相結(jié)合,以更好地解釋疾病的本質(zhì)和發(fā)展規(guī)律,實(shí)現(xiàn)更加客觀、精準(zhǔn)的中醫(yī)診斷。人工智能輔助中醫(yī)辨證的具體框架描述如圖2所示,通過(guò)傳感器等智能設(shè)備采集和分析患者的癥狀、體征、舌象、脈象等多維多模數(shù)據(jù),實(shí)現(xiàn)傳統(tǒng)中醫(yī)辨證中“望、聞、問(wèn)、切”的信息采集過(guò)程。在完成信息的“輸入”階段后,人工智能輔助中醫(yī)辨證的核心在于“計(jì)算”階段,即讓機(jī)器學(xué)習(xí)和理解中醫(yī)的知識(shí)體系,以形成機(jī)器“辨證”機(jī)制,達(dá)到辨證過(guò)程可解釋、辨證結(jié)果可量化、辨證模型可泛化以及可實(shí)用的目的。最終,機(jī)器可以基于這些學(xué)習(xí)到的知識(shí),給出精準(zhǔn)且客觀的辨證結(jié)果,完成“輸出”階段。

圖2 人工智能輔助中醫(yī)辨證框架圖
三、人工智能輔助中醫(yī)辨證的關(guān)鍵問(wèn)題
人工智能輔助中醫(yī)辨證具有巨大的潛力和優(yōu)勢(shì),但在具體實(shí)踐應(yīng)用中,面臨著多模態(tài)數(shù)據(jù)融合、癥狀關(guān)聯(lián)分析、證候量化以及證候推理等多個(gè)關(guān)鍵問(wèn)題。解決這些問(wèn)題需要綜合運(yùn)用現(xiàn)代計(jì)算機(jī)科學(xué)、數(shù)據(jù)科學(xué)等多學(xué)科的知識(shí)和技術(shù),同時(shí)也需要深入理解和挖掘中醫(yī)的辨證理論與實(shí)踐經(jīng)驗(yàn)。
(一)多模態(tài)數(shù)據(jù)融合:提供更豐富、全面的診斷信息,提高中醫(yī)診斷的準(zhǔn)確性
多模態(tài)數(shù)據(jù)融合是人工智能輔助中醫(yī)辨證的基礎(chǔ)。中醫(yī)辨證知識(shí)的來(lái)源豐富,既有中醫(yī)典籍中的經(jīng)典理論和知識(shí),也有蘊(yùn)含在中醫(yī)專(zhuān)家診斷數(shù)據(jù)中的臨床診斷經(jīng)驗(yàn)。此外,中醫(yī)辨證講求“望、聞、問(wèn)、切,四診合參”,其中“望、聞、問(wèn)、切”采集的臨床資料屬于多模態(tài)數(shù)據(jù)。實(shí)踐中需將來(lái)自不同數(shù)據(jù)源的信息,如望診、聞診、問(wèn)診和切診所得的數(shù)據(jù),有效融合成一個(gè)綜合的患者信息庫(kù)。首先,將采集的舌診圖像、面診圖像以及診斷量表數(shù)據(jù),構(gòu)建成中醫(yī)診斷信息數(shù)據(jù)集;然后,根據(jù)數(shù)據(jù)集中的數(shù)據(jù)模態(tài),選擇合適的處理方法;最后,再結(jié)合多模態(tài)數(shù)據(jù)融合架構(gòu)共同形成診斷模型。目前,多模態(tài)數(shù)據(jù)融合技術(shù)已有效地應(yīng)用于多個(gè)中醫(yī)診斷場(chǎng)景中,如2型糖尿病、陰虛證、皮膚癌、輕度抑郁癥等,展現(xiàn)出其卓越的實(shí)用價(jià)值。其中,針對(duì)2型糖尿病陰虛證的診斷是通過(guò)收集2型糖尿病患者的臨床診斷信息,包括舌診圖像、目診圖像以及診斷量表數(shù)據(jù),建立中醫(yī)診斷信息數(shù)據(jù)集;在數(shù)據(jù)經(jīng)過(guò)預(yù)處理后,根據(jù)模態(tài)選擇合適的處理方法;采用VGG16、VGG19、ResNet34、ResNet50及GoogLeNet深度神經(jīng)網(wǎng)絡(luò)對(duì)圖像數(shù)據(jù)進(jìn)行分析,采用支持向量機(jī)(SVM)、隨機(jī)森林以及K近鄰對(duì)量表數(shù)據(jù)進(jìn)行分析,再結(jié)合多模態(tài)數(shù)據(jù)融合架構(gòu)共同形成診斷模型,為中醫(yī)智能診斷提供了新的思路和方法。
(二)癥狀關(guān)聯(lián)性分析:挖掘癥狀 ? 癥狀、癥狀 ? 證候關(guān)聯(lián)關(guān)系,增強(qiáng)中醫(yī)診斷的解釋性
癥狀關(guān)聯(lián)分析是智能中醫(yī)辨證的核心之一。在中醫(yī)理論中,癥狀之間往往存在復(fù)雜的關(guān)聯(lián)關(guān)系,需利用關(guān)聯(lián)規(guī)則挖掘、聚類(lèi)分析等數(shù)據(jù)分析技術(shù),揭示這些癥狀之間的關(guān)聯(lián)規(guī)律,從而增強(qiáng)中醫(yī)診斷過(guò)程的透明性和結(jié)果的可解釋性。臨床上,經(jīng)常存在一體多癥的患者,尤其是老年人往往同時(shí)合并多種病癥,導(dǎo)致臨床癥狀復(fù)雜多樣。中醫(yī)辨證中不同病癥的癥狀之間會(huì)相互影響,不相干的癥狀會(huì)對(duì)辨證過(guò)程產(chǎn)生干擾;同時(shí),同一組證候下癥狀與癥狀之間存在冗余,會(huì)增加系統(tǒng)辨證的復(fù)雜性。因此,癥狀關(guān)聯(lián)分析主要對(duì)患者的癥狀進(jìn)行深入分析,以抓住重點(diǎn)癥狀、剔除模糊癥狀和冗余癥狀,其中涉及對(duì)患者臨床表現(xiàn)的觀察、癥狀關(guān)聯(lián)性的探究以及重點(diǎn)癥狀的挖掘。利用數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的方法,將多種癥狀信息進(jìn)行特征融合,建立關(guān)聯(lián)分析模型,計(jì)算癥狀與癥狀之間以及癥狀與證候之間的相關(guān)性,以揭示癥狀與證候之間的內(nèi)在規(guī)律。目前,針對(duì)癥狀關(guān)聯(lián)性分析的問(wèn)題已在多種病癥上開(kāi)展研究,如多囊卵巢綜合征、2型糖尿病等。從證候構(gòu)成層面探討多囊卵巢綜合征常見(jiàn)基本證型遞進(jìn)分層與跨層關(guān)聯(lián)的癥狀關(guān)系,并嘗試將癥狀關(guān)系融入證候量表,實(shí)現(xiàn)條目間及條目與維度間的雙向關(guān)聯(lián),深化病機(jī)認(rèn)識(shí),提高證候診斷準(zhǔn)確性。
(三)證候量化:構(gòu)建量化模型及量化指標(biāo),克服傳統(tǒng)中醫(yī)客觀量化的不足
證候量化是智能中醫(yī)辨證的另一個(gè)關(guān)鍵問(wèn)題。傳統(tǒng)中醫(yī)的辨證結(jié)果往往依賴(lài)于醫(yī)生的主觀判斷和經(jīng)驗(yàn),缺乏客觀性和可量化性。量化技術(shù)可以在一定程度上實(shí)現(xiàn)中醫(yī)客觀化診斷與療效標(biāo)準(zhǔn)化評(píng)價(jià),將患者的證候轉(zhuǎn)化為可計(jì)算、可度量的數(shù)值,以實(shí)現(xiàn)辨證的客觀化和精確化。這對(duì)于開(kāi)展以證候?yàn)楹诵牡呐R床研究具有一定意義的科研價(jià)值和實(shí)踐應(yīng)用價(jià)值。中醫(yī)證候本身有一些名稱(chēng)具有量化區(qū)分度,如口渴有微渴、大渴之別,發(fā)熱有微熱、壯熱之別。朱文鋒在《證素辨證學(xué)》中曾進(jìn)行過(guò)輕、中、重的簡(jiǎn)單量化。此外,證候還有時(shí)間維度的量化,如對(duì)疼痛緩急的描述,有長(zhǎng)期疼痛、急性疼痛等。但是這種描述方式比較模糊,不符合計(jì)算機(jī)對(duì)精確性的要求。現(xiàn)有的主要證候量化方式是構(gòu)建量表,但其需借助文獻(xiàn)研究、專(zhuān)家咨詢、臨床調(diào)查等一系列流程,工作量極大。針對(duì)智能化證候量化的需求,構(gòu)建量化模型及量化指標(biāo),優(yōu)化模型參數(shù),規(guī)范計(jì)量單位。目前,利用半經(jīng)驗(yàn)分子軌道(SEMO)、李克特(Likert)分級(jí)、相對(duì)熵等方法量化癥狀 / 證候數(shù)據(jù),采用神經(jīng)網(wǎng)絡(luò)、SVM、深度極限學(xué)習(xí)機(jī)等方法對(duì)量化模型進(jìn)行訓(xùn)練、測(cè)試。該方法已在肺癌、抑郁癥、冠心病等病癥方面開(kāi)展了研究。其中,針對(duì)肺癌的診斷,通過(guò)從江西中醫(yī)藥大學(xué)附屬醫(yī)院收集到的2015年1月—2021年12月的497例肺癌病歷中,篩選412例病歷作為研究對(duì)象。利用特征選擇和特征重要性排序等方法歸納出不同證型的證型因子,并使用Likert分級(jí)法量化證型因子;構(gòu)建基于麻雀搜索算法優(yōu)化的深度極限學(xué)習(xí)機(jī),對(duì)模型進(jìn)行訓(xùn)練、測(cè)試,為模型在臨床上的研究提供了科學(xué)的技術(shù)手段。同時(shí)還有研究團(tuán)隊(duì)探索基于脫氧核糖核酸(DNA)甲基化的中醫(yī)概念量化表征方法,實(shí)現(xiàn)證候與現(xiàn)代醫(yī)學(xué)通路的結(jié)合創(chuàng)新。
(四)證候推理:將推理模型融合醫(yī)學(xué)知識(shí)規(guī)則,提高證候推理模型的泛化性
證候推理是智能中醫(yī)辨證的關(guān)鍵環(huán)節(jié)。傳統(tǒng)證候推理受醫(yī)生主觀性思維差異和患者個(gè)體化復(fù)雜特征的影響,癥狀和體征與證候分類(lèi)之間存在復(fù)雜的對(duì)應(yīng)關(guān)系,導(dǎo)致推理結(jié)果呈現(xiàn)出不確定性、模糊性、高維性。將中醫(yī)理論與數(shù)學(xué)及計(jì)算機(jī)科學(xué)緊密結(jié)合,融入人工智能技術(shù)進(jìn)行證候推理是解決上述問(wèn)題的重要途徑。但當(dāng)前智能證候推理面臨使用模型單一、推理模式難以適用于多種病種、單純依靠病例等數(shù)據(jù)學(xué)習(xí)而未融入醫(yī)學(xué)知識(shí)規(guī)則等問(wèn)題,使得推理的精確度與適應(yīng)度均有待提高。在獲取患者的多模態(tài)數(shù)據(jù)后,需通過(guò)證候推理來(lái)得出最終的辨證結(jié)果。這涉及到如何從海量的數(shù)據(jù)和信息中提取出關(guān)鍵信息、如何構(gòu)建有效的推理模型以及如何確保推理結(jié)果的準(zhǔn)確性和可靠性等問(wèn)題。
目前,在小規(guī)模醫(yī)療樣本的場(chǎng)景下,借助貝葉斯網(wǎng)絡(luò)、SVM、隨機(jī)森林等傳統(tǒng)機(jī)器學(xué)習(xí)算法,對(duì)重癥肺炎、慢性腎炎、小兒肺炎等證候推理的準(zhǔn)確率可以達(dá)到85%以上。通過(guò)收集中國(guó)中醫(yī)科學(xué)院望京醫(yī)院重癥醫(yī)學(xué)科247例重癥肺炎患者的中醫(yī)證候信息,然后利用貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)技術(shù)建立證候間的貝葉斯網(wǎng)絡(luò)概率模型,最后結(jié)合專(zhuān)家經(jīng)驗(yàn),提取重癥肺炎的常見(jiàn)證型。在大規(guī)模醫(yī)療樣本的場(chǎng)景下,借助注意力機(jī)制、Transformer、卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法,對(duì)心血管疾病、冠心病、哮喘等的證候推理結(jié)果相較前期同類(lèi)型的推理模型,表現(xiàn)出明顯的優(yōu)越性。其中,針對(duì)冠心病診斷,以冠心病證候要素為關(guān)鍵環(huán)節(jié),基于“癥狀 ? 證候要素 ? 證候 ? 治法 ? 方劑 ? 藥物(劑量)”的臨證診療思路搭建基本邏輯,綜合運(yùn)用多頭注意力機(jī)制、復(fù)合詞向量、隨機(jī)失活形成改良Transformer算法,模擬臨床醫(yī)師臨證思路,形成具備冠心病中醫(yī)證候要素判斷、證候診斷、方藥推薦、可更新迭代功能的智能化模型。在癥狀信息模糊或以序貫式癥狀信息輸入的自主問(wèn)答場(chǎng)景中,借助強(qiáng)化學(xué)習(xí)、深度Q網(wǎng)絡(luò)(DQN)、知識(shí)圖譜等技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了問(wèn)診小程序和后臺(tái)知識(shí)管理系統(tǒng)。通過(guò)對(duì)系統(tǒng)進(jìn)行需求分析,確定了問(wèn)診系統(tǒng)的架構(gòu)和功能設(shè)計(jì),完成了小程序端的系統(tǒng)實(shí)現(xiàn)。問(wèn)診小程序通過(guò)與病人交互,識(shí)別患者回答中的癥狀實(shí)體作為癥狀參數(shù),進(jìn)行證候推理;當(dāng)推理信息不足時(shí)進(jìn)行癥狀求證,詢問(wèn)病人是否有相關(guān)癥狀,從而主導(dǎo)和病人的對(duì)話過(guò)程,補(bǔ)全癥狀參數(shù),最終得到證候,并輸出診療結(jié)果,實(shí)現(xiàn)中醫(yī)證候魯棒推理以及自主診斷。
(五)中醫(yī)藥大模型:以人工智能對(duì)話模式,為用戶提供高效、便捷的中醫(yī)藥服務(wù)
隨著人工智能技術(shù)的飛速發(fā)展,大語(yǔ)言模型逐漸展現(xiàn)出了強(qiáng)大的應(yīng)用潛力,其出色的對(duì)話生成和語(yǔ)義理解能力,贏得了廣大用戶的喜愛(ài),并逐漸擴(kuò)展到了教育、金融、醫(yī)學(xué)、法律、娛樂(lè)、客服等多個(gè)領(lǐng)域。2023年,中醫(yī)藥大模型“岐黃問(wèn)道”率先將生成式人工智能引入到中醫(yī)藥領(lǐng)域,開(kāi)辟了國(guó)內(nèi)中醫(yī)藥大模型的研究之路。但是,中醫(yī)藥知識(shí)體系龐大、細(xì)分領(lǐng)域眾多,僅僅通過(guò)中醫(yī)藥基礎(chǔ)大模型不能完全實(shí)現(xiàn)對(duì)中醫(yī)藥細(xì)分領(lǐng)域知識(shí)的深度解讀。因此,需要設(shè)計(jì)中醫(yī)藥細(xì)分領(lǐng)域大模型為中間層,以更好地服務(wù)中醫(yī)藥細(xì)分領(lǐng)域大模型。
張鶴譯等以中醫(yī)藥方劑領(lǐng)域的應(yīng)用為例,收集領(lǐng)域相關(guān)數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)強(qiáng)化大語(yǔ)言模型的信息抽取能力,利用生成的自然語(yǔ)言回答,從中抽取出結(jié)構(gòu)化知識(shí),并和專(zhuān)業(yè)知識(shí)圖譜匹配以進(jìn)行專(zhuān)業(yè)驗(yàn)證,同時(shí)可以將結(jié)構(gòu)化知識(shí)轉(zhuǎn)化成易讀的自然語(yǔ)言,實(shí)現(xiàn)了大模型與知識(shí)圖譜的深度結(jié)合。Xu等提出了一種動(dòng)態(tài)增長(zhǎng)的知識(shí)圖構(gòu)建方法,使用BERT-CRF方法進(jìn)行命名實(shí)體識(shí)別以及Bootstrapping方法進(jìn)行關(guān)系提取,最后將結(jié)構(gòu)化數(shù)據(jù)合并到現(xiàn)有的知識(shí)圖譜中,實(shí)現(xiàn)動(dòng)態(tài)構(gòu)建大模型知識(shí)庫(kù)。Ye等利用知識(shí)圖譜的檢索信息補(bǔ)充中醫(yī)數(shù)據(jù)在大模型信息庫(kù)中的文本表示,與基線模型BERT相比,該方法可以在辨證輔助任務(wù)上提高相關(guān)性能。
中醫(yī)藥大模型關(guān)鍵技術(shù)主要涵蓋高質(zhì)量、深度學(xué)習(xí)算法、知識(shí)圖譜、自然語(yǔ)言處理以及可解釋性技術(shù)等部分。首先,通過(guò)數(shù)據(jù)收集和預(yù)處理,為模型訓(xùn)練提供充足和準(zhǔn)確的信息。其次,利用深度學(xué)習(xí)算法,如卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等,從海量數(shù)據(jù)中提取有效特征,進(jìn)行分類(lèi)、預(yù)測(cè)等任務(wù)。同時(shí),知識(shí)圖譜作為中醫(yī)藥領(lǐng)域知識(shí)的寶庫(kù),為大模型提供豐富的背景信息和推理依據(jù)。自然語(yǔ)言處理技術(shù)則助力大模型理解病歷、中藥方劑等文本數(shù)據(jù)的真實(shí)含義,為診斷和治療提供更有價(jià)值的參考。最后,通過(guò)可視化技術(shù)和解釋性算法等手段,增強(qiáng)大模型的可解釋性,使用戶能夠理解模型的推理過(guò)程和結(jié)果。這個(gè)框架將各項(xiàng)關(guān)鍵技術(shù)有機(jī)結(jié)合,共同推動(dòng)中醫(yī)藥的智能化發(fā)展,為醫(yī)療行業(yè)提供更高效、精準(zhǔn)的服務(wù)。
四、人工智能輔助中醫(yī)辨證面臨的挑戰(zhàn)
經(jīng)過(guò)對(duì)人工智能輔助中醫(yī)辨證的關(guān)鍵問(wèn)題進(jìn)行系統(tǒng)梳理與深入分析,可以觀察到人工智能在輔助中醫(yī)辨證方面取得了顯著進(jìn)展。通過(guò)多模態(tài)數(shù)據(jù)融合、癥狀關(guān)聯(lián)性分析以及證候量化和推理等技術(shù)手段,人工智能為中醫(yī)診斷提供了更為豐富、全面的信息支持,并增強(qiáng)了診斷的解釋性,填補(bǔ)了傳統(tǒng)中醫(yī)在客觀量化方面的空白。然而,在中醫(yī)臨床實(shí)踐的應(yīng)用和推廣過(guò)程中,仍面臨著一系列技術(shù)挑戰(zhàn)。
(一)可利用的公開(kāi)數(shù)據(jù)不足且質(zhì)量參差不齊
中醫(yī)診斷涉及復(fù)雜的辨證過(guò)程,通常需要結(jié)合多種數(shù)據(jù)源,如患者的主觀描述、醫(yī)生的觀察以及多種檢查結(jié)果等。然而,中醫(yī)診斷的個(gè)性化、經(jīng)驗(yàn)性和主觀性,導(dǎo)致目前公開(kāi)可用的中醫(yī)相關(guān)數(shù)據(jù)集較少;而缺乏充足的數(shù)據(jù)集,直接限制了智能辨證模型的訓(xùn)練和驗(yàn)證,導(dǎo)致模型性能難以達(dá)到預(yù)期。
同時(shí),已有公開(kāi)數(shù)據(jù)集的質(zhì)量也存在著較大的差異。目前可用于辨證模型訓(xùn)練的數(shù)據(jù)集主要來(lái)源于住院病歷和門(mén)診醫(yī)案,但往往因?yàn)橹嗅t(yī)醫(yī)師的經(jīng)驗(yàn)和個(gè)人習(xí)慣,導(dǎo)致這些數(shù)據(jù)存在著標(biāo)注不準(zhǔn)確、信息不完整、數(shù)據(jù)格式不統(tǒng)一等問(wèn)題。此外,中醫(yī)辨證強(qiáng)調(diào)的個(gè)性化治療導(dǎo)致現(xiàn)有的公開(kāi)數(shù)據(jù)可能僅涵蓋部分疾病或癥狀,缺乏多樣性和代表性。這可能會(huì)導(dǎo)致辨證模型在處理某些罕見(jiàn)或特殊病例時(shí)表現(xiàn)不佳,限制了模型的實(shí)際應(yīng)用范圍。
(二)辨證模型單一,普適性不佳
從目前的文獻(xiàn)報(bào)道和實(shí)際應(yīng)用情況來(lái)看,大多數(shù)的智能辨證模型都是針對(duì)某一特定病種或證型進(jìn)行設(shè)計(jì)的,這導(dǎo)致模型的應(yīng)用范圍非常有限,難以適應(yīng)中醫(yī)臨床實(shí)踐中復(fù)雜的辨證需求。
一方面是模型設(shè)計(jì)的局限性。當(dāng)前的智能辨證模型往往在設(shè)計(jì)之初就設(shè)定了固定的分類(lèi)框架,即先將疾病劃分為幾個(gè)固定的證型,然后基于這些證型進(jìn)行模型的訓(xùn)練,這種做法雖然在一定程度上簡(jiǎn)化了問(wèn)題,但是帶來(lái)了很大的局限性。因?yàn)橹嗅t(yī)的辨證過(guò)程是一個(gè)動(dòng)態(tài)的、靈活的過(guò)程,它涉及對(duì)患者整體狀況的全面考量,而不僅僅是簡(jiǎn)單的證型分類(lèi)。這種固定的分類(lèi)框架很難涵蓋所有的臨床情況,一旦遇到不符合先驗(yàn)知識(shí)的情形,模型就很難給出正確的辨證結(jié)果。
另一方面,中醫(yī)認(rèn)為疾病的發(fā)生和發(fā)展是一個(gè)復(fù)雜的過(guò)程,涉及多種因素的相互作用,而現(xiàn)有的智能辨證模型往往只關(guān)注其中的一部分因素,忽略了其他可能對(duì)辨證結(jié)果產(chǎn)生影響的因素。這種簡(jiǎn)化處理雖然可以降低模型的復(fù)雜度,但也導(dǎo)致了模型普適性的降低。在實(shí)際的臨床實(shí)踐中,醫(yī)生需要綜合考慮各種因素來(lái)進(jìn)行辨證,而不僅僅是依據(jù)幾個(gè)固定證型。
(三)辨證模型的可解釋性不足且存在差異
中醫(yī)的辨證過(guò)程往往涉及復(fù)雜的邏輯推理和豐富的實(shí)踐經(jīng)驗(yàn),而當(dāng)前的智能辨證模型在解釋性方面存在明顯不足,同時(shí)由于模型大多根據(jù)不同派別的專(zhuān)家思維進(jìn)行設(shè)計(jì),導(dǎo)致不同模型之間的解釋存在差異。
當(dāng)前,絕大多數(shù)智能中醫(yī)辨證研究均依賴(lài)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型。然而,由于這些模型內(nèi)部運(yùn)作機(jī)制復(fù)雜且不夠透明,難以對(duì)其決策過(guò)程進(jìn)行解釋?zhuān)蚨1憩F(xiàn)出“黑箱”特性。對(duì)于非專(zhuān)業(yè)人士來(lái)說(shuō)很難理解。這導(dǎo)致了模型在輸出結(jié)果時(shí),醫(yī)生難以理解模型為何做出這樣的判斷,從而降低了模型的接受度。
不同研究團(tuán)隊(duì)在開(kāi)發(fā)智能辨證模型時(shí)往往都是借鑒某一位或某一派別的名老中醫(yī)辨證思維,采用不同的方法、數(shù)據(jù)集和算法,導(dǎo)致不同模型之間的解釋性存在差異。這樣的差異性使得醫(yī)生在面對(duì)多個(gè)模型給出的結(jié)果時(shí)難以選擇,同時(shí)也增加了模型之間的比較和評(píng)價(jià)難度。
(四)辨證模型結(jié)果評(píng)價(jià)存在局限,缺乏可信度
目前,智能辨證模型的評(píng)價(jià)主要依賴(lài)傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)領(lǐng)域的評(píng)價(jià)標(biāo)準(zhǔn),如準(zhǔn)確率、錯(cuò)誤率、回歸率等。這些評(píng)價(jià)標(biāo)準(zhǔn)雖然可以提供一定的性能概況,但無(wú)法全面反映模型在實(shí)際應(yīng)用中的可信度和有效性。因?yàn)檫@些評(píng)價(jià)標(biāo)準(zhǔn)往往只關(guān)注模型的預(yù)測(cè)結(jié)果是否正確,而忽略了模型決策過(guò)程和內(nèi)部邏輯的解釋性。在中醫(yī)領(lǐng)域,這種評(píng)價(jià)方式顯然是不夠的,因?yàn)橹嗅t(yī)的辨證信息通常具有模糊性、不確定性和非線性等特點(diǎn),所以,僅僅依靠傳統(tǒng)的評(píng)價(jià)指標(biāo)來(lái)評(píng)估智能辨證模型的結(jié)果是不可靠的。
此外,中醫(yī)辨證過(guò)程是一個(gè)基于經(jīng)驗(yàn)和直覺(jué)的過(guò)程,涉及到大量的主觀判斷和邏輯推理,因此,評(píng)價(jià)智能辨證模型的結(jié)果需要考慮到中醫(yī)的特點(diǎn)。然而,目前缺乏符合中醫(yī)特點(diǎn)的評(píng)價(jià)方式,使得對(duì)模型結(jié)果的評(píng)價(jià)變得困難。為了解決這個(gè)問(wèn)題,需要研究和發(fā)展符合中醫(yī)特點(diǎn)的評(píng)價(jià)標(biāo)準(zhǔn)和方法,以便更好地評(píng)估模型在實(shí)際應(yīng)用中的表現(xiàn)。這些評(píng)價(jià)標(biāo)準(zhǔn)和方法應(yīng)能夠全面反映模型的性能、穩(wěn)定性和可信度等,同時(shí)也要考慮中醫(yī)領(lǐng)域的需求和特點(diǎn)。
(五)辨證模型弱化了中醫(yī)辨證的特色思維和邏輯
中醫(yī)辨證是醫(yī)生在頭腦中運(yùn)用中醫(yī)理論處理患者臨床癥狀、體征及其相關(guān)聯(lián)的生理病理信息并得出診斷結(jié)果的過(guò)程。醫(yī)生經(jīng)過(guò)“望、聞、問(wèn)、切”的方法收集患者信息,進(jìn)行綜合分析而得出辨證結(jié)論。在這個(gè)過(guò)程中,醫(yī)生需要運(yùn)用專(zhuān)業(yè)知識(shí)明確其中的病位、病性、病機(jī)、傳變趨勢(shì)等信息。在中醫(yī)辨證與人工智能技術(shù)相融合的發(fā)展過(guò)程中需要海量的中醫(yī)數(shù)據(jù)支撐,以及對(duì)這些數(shù)據(jù)進(jìn)行分析、挖掘與應(yīng)用。然而,目前很多分析是基于數(shù)據(jù)層面的現(xiàn)象展現(xiàn),少有運(yùn)用中醫(yī)理論或辨證思維邏輯進(jìn)行處理。
針對(duì)數(shù)據(jù)驅(qū)動(dòng)下的智能辨證模型,利用大數(shù)據(jù)分析、挖掘和應(yīng)用技術(shù),對(duì)海量的中醫(yī)臨床數(shù)據(jù)進(jìn)行深入研究,以構(gòu)建高效、準(zhǔn)確的辨證模型。這種方法在一定程度上能夠提高模型的預(yù)測(cè)準(zhǔn)確率,但卻可能忽視了中醫(yī)理論的重要性。中醫(yī)理論是中醫(yī)辨證的基礎(chǔ),包含了豐富的哲學(xué)思想、醫(yī)學(xué)知識(shí)和實(shí)踐經(jīng)驗(yàn)。在智能辨證模型的開(kāi)發(fā)過(guò)程中,如果過(guò)分依賴(lài)數(shù)據(jù)驅(qū)動(dòng)而忽視理論驅(qū)動(dòng),將會(huì)導(dǎo)致模型失去中醫(yī)辨證的特色思維和邏輯。
同時(shí),模型簡(jiǎn)化與中醫(yī)復(fù)雜性的矛盾也是關(guān)鍵因素之一。當(dāng)前的智能辨證模型往往為了簡(jiǎn)化計(jì)算和提高預(yù)測(cè)準(zhǔn)確率,對(duì)中醫(yī)的辨證過(guò)程進(jìn)行過(guò)度簡(jiǎn)化。這種簡(jiǎn)化可能導(dǎo)致模型無(wú)法全面、準(zhǔn)確地反映中醫(yī)的辨證思維和邏輯。例如,一些模型可能只關(guān)注患者的某些癥狀或體征,而忽視了其他癥狀或體征之間的聯(lián)系和影響。這種簡(jiǎn)化與中醫(yī)的復(fù)雜性相矛盾,導(dǎo)致智能辨證模型在一定程度上失去了中醫(yī)辨證的特色。
(六)缺乏多學(xué)科背景的專(zhuān)業(yè)人才以及創(chuàng)新思維
智能辨證模型的開(kāi)發(fā)需要融合多個(gè)領(lǐng)域的知識(shí),包括中醫(yī)學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)等。然而,目前從事智能辨證模型研究的人員往往只具備單一學(xué)科背景,缺乏跨學(xué)科的知識(shí)和技能。這導(dǎo)致在模型設(shè)計(jì)、開(kāi)發(fā)和應(yīng)用過(guò)程中,難以充分理解和運(yùn)用中醫(yī)的辨證思維和邏輯,容易出現(xiàn)對(duì)中醫(yī)理論的誤解或忽視。
此外,在智能辨證模型的研究與應(yīng)用中,需要不斷創(chuàng)新思維和方法,以推動(dòng)模型性能的提升和應(yīng)用范圍的擴(kuò)大。然而,目前研究往往局限于傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架內(nèi),缺乏創(chuàng)新思維和方法。這導(dǎo)致智能辨證模型在發(fā)展過(guò)程中難以取得突破性進(jìn)展,也限制了其在中醫(yī)臨床實(shí)踐中的應(yīng)用和推廣。
五、人工智能輔助中醫(yī)辨證的發(fā)展建議
(一)加強(qiáng)數(shù)據(jù)整合與質(zhì)量把控
建立嚴(yán)格的數(shù)據(jù)治理機(jī)制,包括數(shù)據(jù)清洗、驗(yàn)證和標(biāo)準(zhǔn)化等步驟,以確保輸入到模型中的數(shù)據(jù)是準(zhǔn)確、可靠和一致的。此外,除了整合現(xiàn)有數(shù)據(jù)資源,還應(yīng)積極尋求與經(jīng)驗(yàn)豐富的老中醫(yī)合作,共享他們的診斷案例和經(jīng)驗(yàn),這不僅能增加數(shù)據(jù)的多樣性和豐富性,還能為模型提供寶貴的中醫(yī)理論支持。
(二)深度融合人工智能技術(shù)與中醫(yī)辨證思維,加強(qiáng)模型可解釋性
探索將人工智能技術(shù)與中醫(yī)的辨證思維深度融合。設(shè)定輸入層為“癥”的表征空間,輸出層為“藥”的預(yù)測(cè)域。模型通過(guò)模擬中醫(yī)理論中“癥 ? 證素 ? 證型 ? 藥”的正向聯(lián)接機(jī)制,實(shí)現(xiàn)從復(fù)雜臨床癥狀到精準(zhǔn)治療藥物的智能映射。以證素之間的映射關(guān)系為例,在癥與證素的映射關(guān)系中,模型引入權(quán)重向量以量化不同癥狀體征對(duì)證素判定的影響,并通過(guò)設(shè)定閾值條件來(lái)判定是否滿足某一證素的標(biāo)準(zhǔn)。權(quán)重的大小不僅反映癥狀與證素之間的相關(guān)性強(qiáng)弱,同時(shí)揭示它們之間的正負(fù)相關(guān)性。當(dāng)各癥狀加權(quán)之和滿足或超越判定證素的閾值時(shí),相應(yīng)的證素得以確定,進(jìn)而作為證型推斷的輸入?yún)?shù),經(jīng)過(guò)一系列復(fù)雜的計(jì)算過(guò)程,最終輸出精準(zhǔn)的治療藥物。例如,五心煩熱與陰虛有強(qiáng)正相關(guān),則權(quán)重較大且為正;舌潤(rùn)與陰虛有強(qiáng)負(fù)相關(guān),則權(quán)重較大且為負(fù)。模型的閾值也會(huì)根據(jù)不同的癥狀輸入進(jìn)行自適應(yīng)動(dòng)態(tài)變化,從而更準(zhǔn)確地反映中醫(yī)辨證的復(fù)雜性和個(gè)體差異。此外,模型還應(yīng)具備反饋回路機(jī)制,能夠依據(jù)患者的實(shí)際療效對(duì)正向聯(lián)接過(guò)程中的權(quán)重和閾值進(jìn)行精細(xì)化調(diào)整,進(jìn)而優(yōu)化模型的性能,提升處方預(yù)測(cè)的準(zhǔn)確度,為中醫(yī)臨床決策提供科學(xué)、客觀的依據(jù)。
(三)發(fā)展中醫(yī)藥細(xì)分領(lǐng)域的大語(yǔ)言模型
為更好地使用、推進(jìn)和發(fā)展中醫(yī)藥大模型,首先,需要在國(guó)家中醫(yī)藥權(quán)威管理機(jī)構(gòu)的支持下,由專(zhuān)門(mén)科研機(jī)構(gòu)建立中醫(yī)藥基礎(chǔ)大模型。然后,針對(duì)中醫(yī)癥狀檢測(cè)、中醫(yī)證候辨識(shí)、中藥處方生成等細(xì)分領(lǐng)域,構(gòu)建中醫(yī)藥細(xì)分領(lǐng)域大模型。將中醫(yī)藥細(xì)分領(lǐng)域大模型推廣至全國(guó)中醫(yī)藥相關(guān)單位,在其私域數(shù)據(jù)集上進(jìn)行訓(xùn)練,并根據(jù)具體的業(yè)務(wù)進(jìn)行擴(kuò)展,實(shí)現(xiàn)中醫(yī)藥大模型落地應(yīng)用。
(四)加強(qiáng)智能中醫(yī)人才隊(duì)伍建設(shè),鼓勵(lì)多領(lǐng)域?qū)<液献?/span>
建立專(zhuān)門(mén)的智能中醫(yī)人才培養(yǎng)機(jī)制,包括培訓(xùn)、研究、實(shí)踐等多個(gè)環(huán)節(jié)。這有助于培養(yǎng)既懂中醫(yī)又懂技術(shù)的專(zhuān)業(yè)人才,為智能辨證模型的研究與應(yīng)用提供有力支持。同時(shí),鼓勵(lì)中醫(yī)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、生物醫(yī)學(xué)工程等多個(gè)領(lǐng)域的專(zhuān)家共同合作,形成跨學(xué)科的研究團(tuán)隊(duì),以結(jié)合各自的專(zhuān)業(yè)知識(shí),共同推動(dòng)智能辨證模型的發(fā)展。
(五)完善國(guó)際標(biāo)準(zhǔn)和法律法規(guī),加強(qiáng)國(guó)際合作與交流
積極參與和推動(dòng)智能中醫(yī)相關(guān)的國(guó)際標(biāo)準(zhǔn)和法律法規(guī)的制定。這有助于確保智能中醫(yī)在全球范圍內(nèi)得到認(rèn)可和推廣,并為其在國(guó)際舞臺(tái)上發(fā)揮更大作用提供有力支撐。同時(shí),與國(guó)際同行進(jìn)行深入的交流和合作,引進(jìn)國(guó)外先進(jìn)的技術(shù)和理念,同時(shí)促進(jìn)中醫(yī)文化的傳播和交流,共同推動(dòng)智能中醫(yī)的發(fā)展和進(jìn)步。

來(lái)源:《中國(guó)工程科學(xué)》