您當(dāng)前的位置:檢測(cè)資訊 > 科研開(kāi)發(fā)
嘉峪檢測(cè)網(wǎng) 2025-05-11 11:31
摘 要Abstract
中醫(yī)藥作為中華民族的寶貴財(cái)富,長(zhǎng)期以來(lái)在預(yù)防和治療疾病方面發(fā)揮著獨(dú)特優(yōu)勢(shì),在國(guó)內(nèi)外科學(xué)界受到廣泛關(guān)注。但中藥原料質(zhì)量標(biāo)準(zhǔn)不規(guī)范、物質(zhì)組成復(fù)雜、作用機(jī)制不清和不良反應(yīng)不明等問(wèn)題制約現(xiàn)代中藥產(chǎn)業(yè)的發(fā)展。而“數(shù)智中藥”概念的提出對(duì)中醫(yī)藥數(shù)據(jù)質(zhì)量和人工智能(AI)特異算法模型提出更高要求,成為推動(dòng)中醫(yī)藥行業(yè)發(fā)展的新動(dòng)力。中藥研發(fā)現(xiàn)代化、數(shù)智化有望為中醫(yī)藥現(xiàn)代化帶來(lái)更多機(jī)遇和創(chuàng)新。本文回顧并總結(jié)了AI 在中醫(yī)藥研發(fā)中的應(yīng)用進(jìn)展,從分子、網(wǎng)絡(luò)、語(yǔ)言和多模態(tài)等多個(gè)層面系統(tǒng)闡述了AI 賦能中醫(yī)藥發(fā)展的關(guān)鍵技術(shù),并提出基于“計(jì)算+ 語(yǔ)言”雙模型的數(shù)智本草大模型,以期為推動(dòng)中醫(yī)藥智能化發(fā)展提供新的研究思路和技術(shù)路徑。
Traditional Chinese medicine (TCM), a treasured heritage of the Chinese nation, has long played a vital role in disease prevention and treatment. It has attracted increasing attention from domestic and international scientific communities.However, challenges such as inconsistent raw material standards, complex chemical compositions, unclear mechanisms of action, insufficient understanding of adverse reaction have hindered the development of the modern TCM industry. The concept of “digital & intelligent TCM” raises higher demands for data quality and AI-specific algorithm models, emerging as a new driving force in the modernization of TCM. The digital transformation of TCM research and development presents new opportunities and innovations. This article reviews the latest progress in the application of AI in TCM, and systematically elaborates on key AI technologies from molecular, network, language, and multimodal perspectives. Furthermore, it proposes an integrated intelligent platform, “Digital Herbal Intelligence,” based on a dual "Computing + Language" model, aiming to offer novel research directions and technological paths for the intelligent development of TCM.
關(guān)鍵詞Key words
中醫(yī)藥;人工智能;數(shù)智中藥;多模態(tài);“計(jì)算+ 語(yǔ)言”雙模型
traditional Chinese medicine; artificial intelligence; digital & intelligent TCM; multimodality; "computing + language"dual model
《“十四五”中醫(yī)藥信息化發(fā)展規(guī)劃》提出:“開(kāi)展云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能、5G、區(qū)塊鏈、智能感知等新一代信息技術(shù)在中醫(yī)藥領(lǐng)域的集成應(yīng)用研究,探索一批中醫(yī)藥數(shù)字化應(yīng)用場(chǎng)景建設(shè)”[1-2]。2024 年初,“數(shù)智中藥”的概念被創(chuàng)造性地提出, 它以人工智能(artificial intelligence,AI) 等科學(xué)技術(shù)為突破,創(chuàng)新性配置包含中醫(yī)藥海量數(shù)據(jù)的新型生產(chǎn)要素,結(jié)合云計(jì)算、大模型等新型技術(shù)手段,通過(guò)實(shí)施中藥產(chǎn)品的“六化三精”,即組方配伍數(shù)智化、物質(zhì)基礎(chǔ)數(shù)智化、量時(shí)毒效數(shù)智化、生產(chǎn)質(zhì)控?cái)?shù)智化、臨床應(yīng)用數(shù)智化、消費(fèi)認(rèn)知數(shù)智化和用藥精準(zhǔn)、生產(chǎn)精智、療效精確,打造數(shù)智中藥研發(fā)新范式,為推動(dòng)中藥產(chǎn)業(yè)全鏈條的跨越式轉(zhuǎn)型升級(jí)提供新的思路和方法[3]。
AI 在現(xiàn)代中藥數(shù)智化研發(fā)中可發(fā)揮關(guān)鍵作用, 相關(guān)技術(shù)包括機(jī)器學(xué)習(xí)(machine learning,ML)、深度學(xué)習(xí)(deep learning,DL)、自然語(yǔ)言處理(natural language processing,NLP)和知識(shí)圖譜(knowledge graph,KG) 等。AI 通過(guò)其強(qiáng)大的數(shù)據(jù)處理能力,可以實(shí)現(xiàn)對(duì)中醫(yī)藥海量數(shù)據(jù)的篩選、分析和歸納,以及古代醫(yī)家診治經(jīng)驗(yàn)與現(xiàn)代臨床數(shù)據(jù)的融合等[4-6] ;同時(shí),AI 的應(yīng)用能夠從復(fù)雜的數(shù)據(jù)中識(shí)別出有價(jià)值的信息,使中醫(yī)藥海量數(shù)據(jù)的結(jié)構(gòu)化和標(biāo)準(zhǔn)化成為可能,有利于揭示中藥復(fù)雜物質(zhì)基礎(chǔ)與作用機(jī)制、臨床療效之間的內(nèi)在聯(lián)系。因此,AI 的應(yīng)用極大地提高了數(shù)智中藥的研發(fā)效率和療效評(píng)估的精準(zhǔn)性,為中藥現(xiàn)代化轉(zhuǎn)型提供了技術(shù)支持[7]。AI 在中藥研發(fā)中的應(yīng)用場(chǎng)景主要包括方劑推薦、天然產(chǎn)物篩選、藥物靶點(diǎn)確證、藥材質(zhì)量標(biāo)準(zhǔn)控制和輔助診療等,見(jiàn)表1[8-34]。

本文從4 個(gè)層面闡述了AI 賦能中醫(yī)藥發(fā)展的技術(shù)路徑,包括在分子層面探索AI 在天然產(chǎn)物研發(fā)中的應(yīng)用、在網(wǎng)絡(luò)層面揭示AI在中藥質(zhì)量控制和方劑優(yōu)化中的價(jià)值、在自然語(yǔ)言層面展現(xiàn)AI 在中醫(yī)診斷和大模型構(gòu)建中的潛力,以及在多模態(tài)層面展示AI 在復(fù)方研制和智能診療中的創(chuàng)新。此外,還提出構(gòu)建基于“計(jì)算+ 語(yǔ)言”雙模型的數(shù)智本草大模型,為中醫(yī)藥的智能化發(fā)展提供系統(tǒng)性解決方案,見(jiàn)圖1。

目前,AI 正在重塑中醫(yī)藥研發(fā)范式,從分子設(shè)計(jì)到多模態(tài)融合,從KG 到大模型構(gòu)建,AI 賦能正推動(dòng)中醫(yī)藥進(jìn)入數(shù)智化發(fā)展新階段。本文系統(tǒng)梳理了AI 在中醫(yī)藥各層面的創(chuàng)新應(yīng)用,以展現(xiàn)數(shù)智中藥的發(fā)展現(xiàn)狀,揭示AI 驅(qū)動(dòng)中醫(yī)藥現(xiàn)代化的廣闊前景,為中醫(yī)藥高質(zhì)量發(fā)展提供新的思路和方向。
1. AI 賦能基于分子層面的數(shù)智中藥研發(fā)
基于分子結(jié)構(gòu)的分子指紋(molecular fingerprints,MF)技術(shù)可以低計(jì)算成本的方式表示大規(guī)?;瘜W(xué)數(shù)據(jù)集中化合物的化學(xué)性質(zhì),將多種類(lèi)型的分子描述符轉(zhuǎn)化成計(jì)算機(jī)可讀格式,同時(shí)保持其固有的物理化學(xué)性質(zhì)[35]。MF 分為2D 指紋和3D 指紋。其中,大多數(shù)MF 的編碼方法僅使用2D 分子圖形信息,包括結(jié)構(gòu)鍵型指紋( 如MACCS)、子結(jié)構(gòu)指紋(如Daylight)和散列指紋(如ECFP)等;而3D 指紋主要是藥效團(tuán)指紋。MF 是一維的二進(jìn)制向量,其中每一個(gè)位點(diǎn)代表了分子中某一特定的結(jié)構(gòu)特征或?qū)傩缘挠袩o(wú)。例如,某一位點(diǎn)可能代表分子中是否含有苯環(huán),或者某個(gè)特定的官能團(tuán)是否存在,見(jiàn)圖2。目前MF 已被廣泛應(yīng)用于天然產(chǎn)物質(zhì)量標(biāo)準(zhǔn)化、藥物發(fā)現(xiàn)、靶點(diǎn)確證和藥物虛擬篩選等領(lǐng)域。

1.1 天然產(chǎn)物靶點(diǎn)發(fā)現(xiàn)
中藥成分靶點(diǎn)的發(fā)現(xiàn)和天然產(chǎn)物挖掘的準(zhǔn)確預(yù)測(cè)對(duì)于新藥的發(fā)現(xiàn)至關(guān)重要。單純使用生物學(xué)實(shí)驗(yàn)來(lái)驗(yàn)證藥物靶標(biāo)結(jié)合譜需要大量時(shí)間和精力,AI 算法在減少藥物搜索空間方面具有顯著優(yōu)勢(shì)。天然產(chǎn)物靶點(diǎn)預(yù)測(cè)工具(Swiss TargetPrediction[36]、SuperPred[37]、TargetHunter[38]和SEA[39] 等) 在天然產(chǎn)物靶點(diǎn)發(fā)現(xiàn)中發(fā)揮著重要作用, 見(jiàn)表2。例如,Xu 等[40] 借助TargetHunter 發(fā)現(xiàn)了鼠尾草主要成分salvinorin A 的潛在靶標(biāo), 包括毒蕈堿樣乙酰膽堿受體2、大麻素受體和多巴胺受體2 等。此外,DL 算法在預(yù)測(cè)藥物靶點(diǎn)方面也表現(xiàn)出了良好的性能, 包括DeepPurpose[41]、DeepDTA[42]、DeepChem[43]、DeepCOP[44]、DrugAI[45] 等。Keum 等[46] 構(gòu)建了6 類(lèi)蛋白預(yù)測(cè)模型, 并通過(guò)ML 算法預(yù)測(cè)化合物與靶蛋白之間的相互作用,結(jié)果提示有幾種重要疾病相關(guān)蛋白被預(yù)測(cè)為天然產(chǎn)物的靶標(biāo)。Liang 等[47] 從公共數(shù)據(jù)庫(kù)中收集了天然產(chǎn)物及其衍生物的活性數(shù)據(jù),并評(píng)估了8 種天然產(chǎn)物靶標(biāo)預(yù)測(cè)方法的性能,包括支持向量機(jī)(support vector machine,SVM)、極值梯度增強(qiáng)(extremegradient boosting,XGBoost)、隨機(jī)森林(random forest,RF)、K- 近鄰算法(K-nearestneighbor,KNN)、樸素貝葉斯(naive Bayes,NB)、前饋神經(jīng)網(wǎng)絡(luò)(feedforward neuralnetwork,F(xiàn)NN)、圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)和遞歸神經(jīng)網(wǎng)絡(luò)(recurrentneural networks,RNN),最后建立了比傳統(tǒng)模型訓(xùn)練表現(xiàn)更好的天然產(chǎn)物特異性靶標(biāo)預(yù)測(cè)模型。

1.2 天然產(chǎn)物虛擬篩選
基于AI 算法對(duì)天然產(chǎn)物數(shù)據(jù)庫(kù)進(jìn)行篩選, 可以發(fā)現(xiàn)具有藥理活性的先導(dǎo)化合物, 主要方法包括基于結(jié)構(gòu)的虛擬篩選(structure-based virtual screening,SBVS) 和基于配體的虛擬篩選(ligand-based virtual screening,LBVS), 見(jiàn)表2。Deng 等[48] 結(jié)合SBVS、LBVS 和AI 算法(如RF、KNN)來(lái)驗(yàn)證分子對(duì)接結(jié)果,發(fā)現(xiàn)山楂和香蒲中含有的活性成分1,2- 二甲基苯和香蒲酸可能是神經(jīng)退行性疾病的有效抑制劑。Zhao 等[49]利用分子對(duì)接技術(shù),首次鑒定出2 種具有高抑制活性的PTP1B天然產(chǎn)物抑制劑黃芩苷和楊梅素,二者抑制活性均高于陽(yáng)性對(duì)照成分熊果酸,并通過(guò)動(dòng)物實(shí)驗(yàn)證實(shí)黃芩苷具有較好的降糖作用。此外,DL 算法通過(guò)分析大量的天然產(chǎn)物數(shù)據(jù)和生物活性數(shù)據(jù)、學(xué)習(xí)分子結(jié)構(gòu)與生物活性之間的關(guān)系,能夠預(yù)測(cè)新分子的活性和性質(zhì),從而篩選出潛在的藥物候選分子,提高篩選的準(zhǔn)確率。Zhang 等[50]利用NB 和遞歸分割(recursive partitioning,RP) 算法, 基于ECFP 和MACCS 分子指紋,構(gòu)建了52 個(gè)阿爾茲海默?。ˋlzheimer disease,AD) 相關(guān)靶標(biāo)的活性分子預(yù)測(cè)模型;通過(guò)對(duì)中國(guó)天然產(chǎn)物化學(xué)成分?jǐn)?shù)據(jù)庫(kù)(China Natural Products Chemical Composition Database,CNPC)、中藥系統(tǒng)藥理學(xué)數(shù)據(jù)庫(kù)與分析平臺(tái)(Traditional Chinese Medicine Systems Pharmacology Database and Analysis Platform,TCMSP) 數(shù)據(jù)庫(kù)中相關(guān)成分進(jìn)行篩選, 發(fā)現(xiàn)了12 種潛在的多靶點(diǎn)抗AD 化合物。Guo 等[51] 利用8999 個(gè)化合物的大規(guī)模數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練, 再基于938 種已知具有抗幽門(mén)螺桿菌活性的化合物進(jìn)行微調(diào),構(gòu)建了DL 模型并成功篩選出小檗堿衍生物8,通過(guò)化學(xué)蛋白質(zhì)組學(xué)結(jié)合液相色譜- 串聯(lián)質(zhì)譜(liquid chromatography mass spectrometry/mass spectrometry,LC-MS/MS)技術(shù)鑒定出SecA 和BamD 為小檗堿衍生物8 的直接作用靶點(diǎn),利用表面等離子體共振(surfaceplasmon resonance,SPR)和細(xì)胞熱轉(zhuǎn)變分析(cellular thermal shift assay,CESTA)驗(yàn)證了小檗堿衍生物8 與這兩個(gè)靶蛋白的特異性相互作用小,同時(shí)發(fā)現(xiàn)小檗堿衍生物8 具有較優(yōu)的抗菌活性和藥代動(dòng)力學(xué)特性,為抗幽門(mén)螺桿菌藥物開(kāi)發(fā)提供了新策略。
1.3 天然產(chǎn)物結(jié)構(gòu)解析和合成
天然產(chǎn)物的結(jié)構(gòu)優(yōu)化對(duì)于發(fā)現(xiàn)具有治療潛力的活性成分、提高藥效、降低毒性和改善藥代動(dòng)力學(xué)特性至關(guān)重要。Morehouse等[52] 提出了質(zhì)譜結(jié)構(gòu)相似性網(wǎng)絡(luò)注釋平臺(tái)(SNAP-MS), 該平臺(tái)與來(lái)自分子網(wǎng)絡(luò)的天然產(chǎn)物圖譜中的化學(xué)相似性分組相匹配,有效解決了天然產(chǎn)物庫(kù)中跨儀器平臺(tái)間二級(jí)質(zhì)譜碎片差異性的標(biāo)準(zhǔn)化難題, 同時(shí)突破了傳統(tǒng)光譜參考庫(kù)覆蓋率低的局限性。Li 等[53] 使用消息傳遞神經(jīng)網(wǎng)絡(luò)(message passing neural networks,MPNNs) 構(gòu)建了一個(gè)二元分類(lèi)模型,其中每個(gè)分子的規(guī)范SMILES 字符串利用RDKit 中可用的規(guī)范化算法生成,每個(gè)字符串都唯一表征其相應(yīng)的化學(xué)結(jié)構(gòu),并結(jié)合分子對(duì)接和分子動(dòng)力學(xué)模擬,從天然產(chǎn)物中鑒定出2 種新的組織蛋白酶L(cathepsin L,CTSL)抑制劑。Hu 等[54] 總結(jié)了ML 輔助MS 和核磁共振譜數(shù)據(jù)分析以確定天然產(chǎn)物化學(xué)結(jié)構(gòu)的最新進(jìn)展,并提出ML 輔助結(jié)構(gòu)解析,主要涉及基于ML 學(xué)習(xí)算法的MS/MS 圖譜相似性計(jì)算、MS/MS 圖譜預(yù)測(cè)和MF 生成方案,為未來(lái)深度融合計(jì)算機(jī)輔助結(jié)構(gòu)解析,加速天然產(chǎn)物研究提供了有益的借鑒。Mikulak-Klucznik 等[55] 利用計(jì)算機(jī)輔助設(shè)計(jì)程序Chematica對(duì)復(fù)雜天然產(chǎn)物進(jìn)行合成路徑預(yù)測(cè),可以實(shí)現(xiàn)各種ML 分子力學(xué)和量子力學(xué)例程,并估計(jì)反應(yīng)產(chǎn)量;設(shè)置heuristic 規(guī)則, 以評(píng)估是否容易發(fā)生副反應(yīng)和重排反應(yīng);此外,在合成規(guī)劃中,通過(guò)heuristic 規(guī)則或神經(jīng)網(wǎng)絡(luò)評(píng)分函數(shù)來(lái)決定。實(shí)驗(yàn)結(jié)果表明,算法生成的合成路線(xiàn)在路徑可行性(如步驟經(jīng)濟(jì)性、立體選擇性控制)等關(guān)鍵指標(biāo)上,與藥物設(shè)計(jì)專(zhuān)家的路徑高度吻合,且研究團(tuán)隊(duì)已成功通過(guò)實(shí)驗(yàn)室合成驗(yàn)證了3 種計(jì)算機(jī)設(shè)計(jì)的天然產(chǎn)物衍生物,證實(shí)了該方法的實(shí)用性與可靠性,見(jiàn)表2。
2. AI 賦能基于網(wǎng)絡(luò)的中藥創(chuàng)新組方及其重定位
基于網(wǎng)絡(luò)的方法通過(guò)揭示中藥方劑- 疾病- 證候- 靶點(diǎn)- 通路之間的作用機(jī)制來(lái)實(shí)現(xiàn)中藥組方及其重定位。其中,主要涉及系統(tǒng)理解宏觀對(duì)象(如方劑、證型和癥狀等)與微觀對(duì)象(如天然產(chǎn)物、疾病和基因等)之間的多層次關(guān)系,并確定能夠系統(tǒng)地耦合這些宏觀和微觀對(duì)象的網(wǎng)絡(luò)元素。從方法論的角度來(lái)看,基于網(wǎng)絡(luò)的方法可以分為3 個(gè)步驟:①基于NLP 或者KG,從中醫(yī)藥古籍或組學(xué)數(shù)據(jù)中挖掘宏觀或微觀對(duì)象之間的關(guān)系,并作為數(shù)據(jù)支撐。②基于網(wǎng)絡(luò)關(guān)系進(jìn)行推理,主要對(duì)中藥/ 天然產(chǎn)物- 疾?。◤姆降讲。?、疾病/ 綜合征- 基因-天然產(chǎn)物/ 方劑(從病到方)等關(guān)系進(jìn)行分析和預(yù)測(cè)。③根據(jù)推斷的網(wǎng)絡(luò)關(guān)系, 探討可能的藥物協(xié)同作用、方劑配伍和方劑生成等。
2.1 中藥質(zhì)量標(biāo)志物(Q-marker)的標(biāo)準(zhǔn)化
由于中藥固有的多組分、多靶點(diǎn)特征,中藥質(zhì)量控制和生物活性評(píng)價(jià)體系正面臨越來(lái)越多的關(guān)注和挑戰(zhàn)。目前,《中國(guó)藥典》采用的質(zhì)量控制體系通常以化學(xué)標(biāo)志物作為核心指導(dǎo)依據(jù),運(yùn)用紫外- 可見(jiàn)光分光光度法、薄層色譜法、高效液相色譜法、氣相色譜法或高效液相色譜- 質(zhì)譜法等多種方法,測(cè)定中藥原材料、提取物、中成藥、中藥飲片以及方劑等的各類(lèi)化學(xué)標(biāo)志物及其含量,進(jìn)而開(kāi)展中藥真?zhèn)舞b定和質(zhì)量評(píng)價(jià)工作[56-57]。然而, 現(xiàn)行《中國(guó)藥典》及質(zhì)量控制相關(guān)專(zhuān)著仍存在明顯的局限性,化學(xué)標(biāo)志物與整體療效之間的關(guān)聯(lián)機(jī)制也存在疑問(wèn),例如單一化學(xué)標(biāo)志物難以反映整體藥效,化學(xué)標(biāo)志物間協(xié)同/ 拮抗效應(yīng)未被量化,化學(xué)標(biāo)志物代謝轉(zhuǎn)化與體內(nèi)動(dòng)力學(xué)過(guò)程未被追蹤等。
近年來(lái), 有學(xué)者提出了Q-marker 的概念[58-59],以解決中藥質(zhì)量標(biāo)準(zhǔn)化問(wèn)題。例如,通過(guò)建立黃芪的指紋圖譜并應(yīng)用網(wǎng)絡(luò)藥理學(xué)分析,張淑娟等[60] 選擇了3 種不同的成分作為黃芪的潛在Q-marker 進(jìn)行標(biāo)記;Hu 等[61]結(jié)合化學(xué)模式識(shí)別、網(wǎng)絡(luò)藥理學(xué)和實(shí)驗(yàn)驗(yàn)證方法,確定了蛛絲毛藍(lán)耳草的Q-marker,并深入探討了其生理機(jī)制。Li 等[62] 將網(wǎng)絡(luò)藥理學(xué)與色譜指紋圖譜、多組分定量分析相結(jié)合來(lái)評(píng)估黃芪質(zhì)量,該方法可全面反映黃芪中各種化學(xué)成分的總體分布情況,并精準(zhǔn)鑒定Q-marker,為中藥質(zhì)量控制提供了新思路。此外,其他基于AI 的Q-marker 評(píng)估方法還包括組學(xué)研究[63],吸收、分布、代謝和排泄(ADME)篩選[64],分子對(duì)接和分子動(dòng)力學(xué)模擬[65] 等,見(jiàn)表3。

2.2 中藥配伍預(yù)測(cè)
中醫(yī)方劑推薦一直是中醫(yī)學(xué)研究的熱點(diǎn),在臨床診療中發(fā)揮著不可或缺的作用。然而,患者的臨床表現(xiàn)往往是個(gè)性化的,如何根據(jù)不同表現(xiàn)推薦相應(yīng)的中藥方劑是亟待解決的問(wèn)題。目前,預(yù)測(cè)有效藥物組合的計(jì)算方法包括基于特征、基于相似性測(cè)量和基于ML 的方法[66-67]。近年來(lái),Li 等[68] 建立了一種基于距離的互信息模型(distance-based mutual information model,DMIM)方法來(lái)識(shí)別中藥生物分子疾病多層網(wǎng)絡(luò)中的“ 協(xié)同模塊”,揭示中藥的有效組合模式。Wang 等[69] 提出了一種基于網(wǎng)絡(luò)的方法來(lái)量化中藥藥對(duì)之間的相互作用。具體而言,通過(guò)搜索并構(gòu)建中藥藥對(duì)的蛋白質(zhì)- 蛋白質(zhì)相互作用網(wǎng)絡(luò),研究人員確定了成分和靶標(biāo)上的最短距離、中心距離、內(nèi)核距離和分離距離等多個(gè)拓?fù)溟撝?,推斷了中藥作用機(jī)制的基本原理,并探索了基于網(wǎng)絡(luò)拓?fù)渥R(shí)別協(xié)同化合物相互作用的中藥組合規(guī)律。Wang 等[70]采用基于網(wǎng)絡(luò)的方法研究了中藥方劑中相關(guān)靶模塊之間的分子網(wǎng)絡(luò)相互作用模式,并進(jìn)一步探索了中藥組合分布與處方之間的相關(guān)性,發(fā)現(xiàn)分級(jí)處方越多,相應(yīng)效果越好,驗(yàn)證了中醫(yī)方劑理論中君臣佐使的配伍原則,為網(wǎng)絡(luò)藥理學(xué)領(lǐng)域的多藥聯(lián)合開(kāi)發(fā)提供了參考, 并為慢性病聯(lián)合治療的臨床應(yīng)用提供了指導(dǎo)。此外,Wang 等[69] 還研究收集了中醫(yī)藥綜合數(shù)據(jù)庫(kù)(Traditional Chinese Medicine Integrated Database,TCMID)中的中藥-成分- 靶點(diǎn)網(wǎng)絡(luò)數(shù)據(jù), 并從公共數(shù)據(jù)庫(kù)(IntAct、InnateDB、PINA 和HPRD 等)中提取蛋白質(zhì)- 蛋白質(zhì)相互作用數(shù)據(jù),通過(guò)確定多個(gè)基于網(wǎng)絡(luò)的距離,包括天然產(chǎn)物和靶標(biāo)水平上的最短距離、中心距離、內(nèi)核距離和分離距離等,發(fā)現(xiàn)常用的中藥藥對(duì)往往具有更短的距離,更有可能影響人類(lèi)相互作用組中的鄰近蛋白質(zhì);該研究進(jìn)一步提出運(yùn)用網(wǎng)絡(luò)藥理學(xué)框架對(duì)中藥相互作用的程度進(jìn)行量化評(píng)估,這一方法有助于更有效地探索中藥組合的潛在空間,通過(guò)解析網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)來(lái)識(shí)別具有協(xié)同作用的天然產(chǎn)物相互作用機(jī)制,見(jiàn)表3。
2.3 中藥藥效和藥性的預(yù)測(cè)
中醫(yī)藥以臨床醫(yī)學(xué)實(shí)踐為根基,依據(jù)患者個(gè)體癥狀表現(xiàn),結(jié)合中藥藥性理論指導(dǎo)用藥,進(jìn)而衍生出種類(lèi)繁多的、可治療疾病的中藥方劑。然而,盡管臨床實(shí)踐數(shù)據(jù)以及針對(duì)單味中藥和(或)方劑的相關(guān)研究均表明某些中藥治療手段的有效性,但目前對(duì)于中藥治療疾病的具體藥效機(jī)制仍缺乏清晰且深入的認(rèn)識(shí)。而基于網(wǎng)絡(luò)的方法為闡釋中藥和(或)方劑治療疾病的藥效機(jī)制提供了可解釋的研究途徑。Gan 等[71]建立了一個(gè)網(wǎng)絡(luò)醫(yī)學(xué)框架,將癥狀相關(guān)蛋白質(zhì)和中藥靶點(diǎn)映射到人類(lèi)蛋白質(zhì)- 蛋白質(zhì)相互作用網(wǎng)絡(luò)上,并分析其拓?fù)潢P(guān)系,以預(yù)測(cè)中藥治療該癥狀的有效性,揭示了中醫(yī)癥狀“通用模塊”治療疾病的科學(xué)原理。Liu 等[72] 通過(guò)GNN 結(jié)合中藥飲片特性,擬合了中藥飲片與方劑藥效的復(fù)雜非線(xiàn)性映射關(guān)系,并預(yù)測(cè)了中藥飲片與方劑藥效之間的關(guān)系。結(jié)果發(fā)現(xiàn),與SVM、NB、邏輯回歸、梯度提升決策樹(shù)(gradient boosting decisiontree ,GBDN)和KNN 等經(jīng)典ML 模型相比, 特性增強(qiáng)圖卷積網(wǎng)絡(luò)(enhanced graph convolutional network,EGCN) 具有更高的預(yù)測(cè)精度。Hu 等[73] 通過(guò)計(jì)算處方中中藥的藥性(即四氣:寒、熱、溫、涼)、藥味(即五味:酸、苦、甘、辛、咸)和歸經(jīng)(心、肝、脾、肺、腎)的比重,分析了單味中藥黃連,黃連- 黃芩藥對(duì),以及經(jīng)典中藥方劑黃連解毒湯、白虎解毒湯和牡丹湯之間的藥性關(guān)系,探索了傳統(tǒng)中藥性質(zhì)和相容性的新方法,有助于驗(yàn)證和闡釋中藥組合理論,見(jiàn)表3。
2.4 中藥方劑推薦
目前,藥物開(kāi)發(fā)成本急劇增加,新靶點(diǎn)發(fā)現(xiàn)面臨的挑戰(zhàn)也日益增加?;诰W(wǎng)絡(luò)的方法可以量化復(fù)雜中藥和(或) 天然產(chǎn)物靶點(diǎn)和疾病之間的相互作用,有利于預(yù)測(cè)新的藥物- 疾病關(guān)聯(lián),為藥物再利用和不良反應(yīng)檢測(cè)提供了合適的方法[74-75]。比如,Zhao 等[31] 構(gòu)建了一種基于多圖卷積網(wǎng)絡(luò)(multi-scaledynamic graph convolutional network,MGCN) 的處方推薦模型來(lái)分析中醫(yī)癥狀和治療處方之間的多元關(guān)系,結(jié)果表明,MGCN 優(yōu)于對(duì)照組算法SVM,可明顯提高中藥處方推薦的準(zhǔn)確性。Yang 等[76] 通過(guò)構(gòu)建中藥KG,引入中藥藥效作為輔助信息,提出了一種具有多層信息融合的圖卷積模型來(lái)實(shí)現(xiàn)中藥方劑的推薦,結(jié)果顯示,與基線(xiàn)模型相比,該模型的精確度和召回率均有很大的提升。Dong 等[77] 提出了PresRecST 模型,該模型基于患者癥狀、治療方法和中藥的KG,整合漸進(jìn)式推薦任務(wù)的知識(shí)圖的嵌入向量,并與中醫(yī)醫(yī)生遵循的實(shí)際診斷和治療程序密切相關(guān),為方劑推薦和輔助診療提供了一種新的方法,見(jiàn)表3。
2.5 天然產(chǎn)物在中藥創(chuàng)新中的應(yīng)用
天然產(chǎn)物不僅具有豐富的骨架多樣性和結(jié)構(gòu)復(fù)雜性,還在新藥發(fā)現(xiàn)中展現(xiàn)出巨大優(yōu)勢(shì),且與傳統(tǒng)化學(xué)合成分子相比,其通常具有較低的毒性和不良反應(yīng)以及多靶點(diǎn)作用等獨(dú)特優(yōu)勢(shì)。Huang等[78] 基于系統(tǒng)藥理學(xué)的方法整合了藥物靶點(diǎn)網(wǎng)絡(luò)和三陰性乳腺癌的大規(guī)模基因組圖譜,篩選出黃酮類(lèi)化合物漢黃芩苷為有效的血管生成抑制劑,為天然產(chǎn)物治療慢性病的藥物發(fā)現(xiàn)提供了一種新方法。Wu 等[79] 設(shè)計(jì)了基于網(wǎng)絡(luò)的方法和特權(quán)子結(jié)構(gòu)識(shí)別的工作流程,并從天然產(chǎn)物庫(kù)中篩選出56 個(gè)醌氧化還原酶1[NAD(P)H:quinone 1,NQO1] 抑制劑,其中,有7 個(gè)在細(xì)胞水平上顯示出具有NQO1 抑制活性,提示其可能具備成為先導(dǎo)化合物的開(kāi)發(fā)潛力;此外,網(wǎng)絡(luò)分析結(jié)果表明,蛇床子素不僅能抑制碳酸酐酶Ⅸ和Ⅻ,還能抑制NQO1,進(jìn)而對(duì)多種腫瘤類(lèi)型具有抑制作用。Wang 等[80]提出了一種綜合化學(xué)特征分析、定量分析、異源物質(zhì)分析、網(wǎng)絡(luò)藥理學(xué)及生物活性評(píng)價(jià)的研究方法,成功從枳實(shí)薤白桂枝湯中篩選出9 個(gè)有效成分。此外,結(jié)合虛擬篩選、化學(xué)蛋白質(zhì)組學(xué)和代謝組學(xué)等多種先進(jìn)技術(shù)可以顯著提高天然產(chǎn)物靶點(diǎn)鑒定的準(zhǔn)確性與效率[81-82],見(jiàn)表3。
3. AI 賦能基于自然語(yǔ)言的中醫(yī)藥診療和藥物研發(fā)
隨著大數(shù)據(jù)在中醫(yī)藥行業(yè)的蓬勃發(fā)展,約80% 的診療數(shù)據(jù)(包括文本、圖像、信號(hào)等)在生成后仍然是非結(jié)構(gòu)化的,且未得到充分開(kāi)發(fā)利用。作為一種AI 技術(shù),NLP 可利用句法和語(yǔ)義分析對(duì)文本數(shù)據(jù)進(jìn)行處理和分析,并有效應(yīng)對(duì)自然語(yǔ)言數(shù)所面臨的挑戰(zhàn),助力人們實(shí)現(xiàn)從耗時(shí)、手動(dòng)和孤立的傳統(tǒng)NLP 管理模式,向文本和語(yǔ)音數(shù)據(jù)分析的自動(dòng)化、大規(guī)模和標(biāo)準(zhǔn)流程轉(zhuǎn)型,進(jìn)而推動(dòng)中醫(yī)藥研究模式從以經(jīng)驗(yàn)為主、宏觀為主,轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為基礎(chǔ)、宏觀與微觀相結(jié)合[83]。目前,基于NLP 的方法在中醫(yī)藥診療和藥物研發(fā)方面得到了廣泛的應(yīng)用。NLP 建模和特征學(xué)習(xí)技術(shù)包括基于transformer 的雙向編碼器表示(bidirectional encoder representations fromtransformers,BERT)、onehot、word2ve2c、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和GNN 等,見(jiàn)表4。其中,one-hot 和word2ve2c 是表征中藥或者中藥方劑特征的常用方法,即將中藥的名稱(chēng)、特征(藥性、藥味)和功效等單詞或者短句映射到固定長(zhǎng)度的實(shí)數(shù)向量中,以表示單詞語(yǔ)義。例如,Cheng等[84] 使用一個(gè)五維向量來(lái)表示方劑中的中藥功效。中藥名稱(chēng)和功效由word2vec 嵌入,中藥的特征由23 位one-hot 嵌入,二維矩陣的每一行對(duì)應(yīng)一種中藥,描述中藥的藥性、藥味、歸經(jīng)和毒性,其中維度1 表示該中藥符合此描述,而維度0 則相反。然后將中藥向量表示作為二維矩陣輸入CNN 進(jìn)行卷積運(yùn)算。

3.1 方劑推薦和分類(lèi)
中醫(yī)醫(yī)生主要通過(guò)對(duì)患者的臨床癥狀進(jìn)行診斷,來(lái)確定治療用的方劑,而缺少表型和成分信息在微觀層面的融合表征。Zhou等[85] 提出了一種基于DL 算法的智能方劑推薦系統(tǒng)(FordNet),通過(guò)卷積提取了20 000 多份電子健康記錄表型信息特征, 運(yùn)用向量化的方法從由中藥、方劑和靶標(biāo)組成的異質(zhì)網(wǎng)絡(luò)中提取中藥特征,然后基于該信息構(gòu)建融合了表型信息和分子信息的中藥方劑特征。臨床評(píng)估結(jié)果表明,F(xiàn)ordNet 具備高效學(xué)習(xí)中醫(yī)醫(yī)師有效經(jīng)驗(yàn)的能力,進(jìn)而實(shí)現(xiàn)新方劑的合理推薦。Cheng 等[84] 提出了一種S-TextBLCNN 模型,用于中藥方劑的療效分類(lèi)。該模型使用NLP 來(lái)學(xué)習(xí)和實(shí)現(xiàn)不同中藥的定量表達(dá), 選擇中藥名稱(chēng)、藥性和功效3 類(lèi)特征對(duì)中藥進(jìn)行編碼,通過(guò)DL 模型建立二元分類(lèi)器,對(duì)中醫(yī)文獻(xiàn)中收集的2664 個(gè)治療中風(fēng)的方劑進(jìn)行分類(lèi)。結(jié)果表明,方劑特征表示與S-TextBLCNN 模型的結(jié)合可有效提高方劑療效分類(lèi)的準(zhǔn)確性,為中藥方劑配伍研究提供了新的研究思路。
3.2 疾病辨證和分類(lèi)及中藥工藝流程
在中醫(yī)對(duì)疾病的認(rèn)識(shí)和治療體系中,陰陽(yáng)失衡、氣血失調(diào)被視為潛在的致病根源。中醫(yī)診療強(qiáng)調(diào)整體觀念、辨證論治,通常需要綜合考慮人體癥狀、環(huán)境因素和患者的個(gè)人體質(zhì),從而提供個(gè)性化的醫(yī)療服務(wù)。Lin 等[86] 通過(guò)整合經(jīng)典中醫(yī)古籍《黃帝內(nèi)經(jīng)》文本數(shù)據(jù),引入NLP 來(lái)量化不同精神疾病描述與五臟六腑、情志的對(duì)應(yīng)關(guān)系。結(jié)果表明,心臟與精神障礙類(lèi)疾病最相關(guān),而與精神疾病相關(guān)的重要情志因素是怒、憂(yōu)與思。Zhou 等[87] 通過(guò)使用NLP 算法構(gòu)建了一個(gè)高質(zhì)量的中醫(yī)癥狀歸一化模型(BERT 分類(lèi)模型),有效解決了中醫(yī)癥狀具有相同含義但字面表達(dá)不同的問(wèn)題。Yao 等[88] 利用未標(biāo)記的臨床語(yǔ)料庫(kù)對(duì)BERT 語(yǔ)言模型進(jìn)行微調(diào),實(shí)現(xiàn)了對(duì)中醫(yī)的臨床記錄進(jìn)行疾病分類(lèi),并揭示了臨床文本中的指示性特征。Li 等[89] 利用詞向量技術(shù)構(gòu)建了中藥名稱(chēng)和藥用部位的特征向量,使用改進(jìn)的詞頻-逆文檔頻率對(duì)特征向量進(jìn)行加權(quán)處理,并利用NLP 的文本分類(lèi)方法將其拓展至中藥復(fù)方煎煮領(lǐng)域,為有效、科學(xué)地延長(zhǎng)中藥復(fù)方煎煮時(shí)間提供了技術(shù)支持。
3.3 輔助診斷
根據(jù)中醫(yī)藥理論, 人體臟腑、陰陽(yáng)、氣血的生理病理變化可以通過(guò)四診法(即望、聞、問(wèn)、切)進(jìn)行診察。然而,四診作為辨證論治的基礎(chǔ),容易受到外部客觀條件(如環(huán)境、光源等)和醫(yī)生主觀判斷的影響,缺乏客觀的定量指標(biāo)。將KG 與中醫(yī)診斷相結(jié)合,可以高效地收集、組織和分析大量中醫(yī)專(zhuān)家醫(yī)療病例數(shù)據(jù)、臨床診療信息和醫(yī)患對(duì)話(huà)記錄等,使系統(tǒng)能夠根據(jù)用戶(hù)報(bào)告的疾病、癥狀和體征提供診斷結(jié)果和治療計(jì)劃,以及實(shí)現(xiàn)個(gè)性化的中醫(yī)健康狀況識(shí)別,推動(dòng)疾病模式模型的發(fā)展,增強(qiáng)中醫(yī)實(shí)踐的客觀性和科學(xué)性[90-92]。例如,Ye 等[93] 提出了一種基于知識(shí)的辯證決策支持模型(knowledge-based decision support model for syndrome differentiation,KDSD), 將醫(yī)療文本與KG 實(shí)體表示(fusing medical text with KG entity representation,F(xiàn)-MT-KER)相融合, 并使用BERT 模型獲取醫(yī)療記錄文本的矢量表示,證明了基于預(yù)訓(xùn)練模型和KG 的多標(biāo)簽分類(lèi)方法可以更好地模擬復(fù)雜病例的中醫(yī)辨證。Yin等[94] 將臨床醫(yī)學(xué)知識(shí)與電子病歷相結(jié)合, 開(kāi)發(fā)出一種基于KG 的耳鳴診斷方法, 該方法很好地闡釋了不同患者耳鳴癥狀相似的原因, 為醫(yī)生提供了一種可靠且可解釋的診斷工具,有望提高耳鳴診斷的準(zhǔn)確性。
3.4 中醫(yī)藥大模型
隨著NLP、BERT 和生成式預(yù)訓(xùn)練轉(zhuǎn)換器(generative pretrained transformer,GPT)等訓(xùn)練模型的快速發(fā)展,中醫(yī)藥領(lǐng)域正經(jīng)歷一場(chǎng)數(shù)字化和智能化的變革。中醫(yī)藥大模型作為代表,旨在整合和分析海量中醫(yī)藥文獻(xiàn)、中醫(yī)藥數(shù)據(jù)庫(kù)、臨床研究資料和醫(yī)案等數(shù)據(jù),通過(guò)訓(xùn)練大語(yǔ)言模型,將其應(yīng)用于中醫(yī)藥現(xiàn)代化的研發(fā)和輔助醫(yī)療中[95-96]。目前,中醫(yī)藥大模型主要包括中醫(yī)藥輔助診療大模型(如神農(nóng)中醫(yī)藥大模型、TCMLLM-PR 大模型、仲景中醫(yī)大模型等)和中藥研發(fā)大模型(如數(shù)智本草大模型、岐黃問(wèn)道大模型等)。部分已發(fā)布的中醫(yī)藥輔助診療和研發(fā)大模型,見(jiàn)表5。

數(shù)智本草大模型是由天士力與華為云聯(lián)合開(kāi)發(fā)的中醫(yī)藥語(yǔ)言大模型和計(jì)算大模型。與ChatGPT 和其他中醫(yī)藥大模型相比,數(shù)智本草大模型具有參數(shù)量更大、產(chǎn)業(yè)證據(jù)更全、數(shù)據(jù)更豐富的明顯優(yōu)勢(shì)。數(shù)智本草大模型對(duì)應(yīng)的“配置”,一方面依托華為澎湃算力與向量庫(kù)等先進(jìn)工具,另一方面注入了中醫(yī)藥守正(包含1000 余部中醫(yī)藥古籍及其翻譯版本、9 萬(wàn)余首方劑、4 萬(wàn)余種中成藥等)、創(chuàng)新(包含4000 多萬(wàn)篇文獻(xiàn)摘要、300 多萬(wàn)個(gè)天然產(chǎn)物等)、產(chǎn)業(yè)化(10 萬(wàn)余份臨床方案、16 萬(wàn)余項(xiàng)中藥專(zhuān)利以及法規(guī)、政策、指南等)三大類(lèi)海量數(shù)據(jù)。數(shù)智本草大模型通過(guò)智能問(wèn)答、交互計(jì)算、文檔生成和智能應(yīng)用4 種模式,可實(shí)現(xiàn)方劑機(jī)制解析、藥物重定位、創(chuàng)新方劑生成、天然產(chǎn)物篩選和分子優(yōu)化等全鏈條研發(fā)輔助。TCMLLMPR通過(guò)整合真實(shí)世界的臨床病歷、醫(yī)學(xué)經(jīng)典和中醫(yī)教材等數(shù)據(jù),構(gòu)建了一個(gè)包含68 000 條處方推薦說(shuō)明的微調(diào)數(shù)據(jù)集。在ChatGLM 大模型上進(jìn)行大規(guī)模指令微調(diào),以實(shí)現(xiàn)中醫(yī)臨床輔助診療(疾病證候診斷、處方推薦等)以及中醫(yī)知識(shí)問(wèn)答等任務(wù)。神農(nóng)中醫(yī)藥大模型預(yù)先基于大量中醫(yī)文獻(xiàn)進(jìn)行了訓(xùn)練,構(gòu)建了一個(gè)能夠理解中醫(yī)術(shù)語(yǔ)和概念的語(yǔ)言模型。該模型可以捕捉中醫(yī)方劑、疾病癥狀和治療方法之間的復(fù)雜關(guān)系,并集成了中醫(yī)KG,使其能夠執(zhí)行復(fù)雜的推理任務(wù),包括病因病機(jī)推理、處方分析和療效預(yù)測(cè)等。
4. AI 賦能基于多模態(tài)數(shù)據(jù)融合的中醫(yī)診療和中藥研發(fā)
中醫(yī)藥多模態(tài)數(shù)據(jù)整合了來(lái)自不同層面的信息資源,具體涵蓋:豐富的文本資料(如中醫(yī)藥古籍、現(xiàn)代研究論文等)、視覺(jué)圖像數(shù)據(jù)(如舌診圖像、醫(yī)學(xué)影像等)、聲音記錄(如脈診分析音頻等),以及通過(guò)傳感器采集的病理生理參數(shù)。此外,該數(shù)據(jù)體系還包含化合物數(shù)據(jù)(用于中藥成分研究)、臨床數(shù)據(jù)(反映患者健康狀況和治療效果)、基因組和蛋白質(zhì)組信息(用于探索個(gè)體化治療差異)、代謝組和微生物組數(shù)據(jù)(揭示藥物作用機(jī)制),以及藥物相互作用信息、患者反饋數(shù)據(jù)、流行病學(xué)統(tǒng)計(jì)結(jié)果、政策法規(guī)文件和教育資源材料等?;诙嗄B(tài)數(shù)據(jù)的整合和分析,AI 在方劑提取流程和工藝優(yōu)化、疾病診斷輔助、方劑推薦和優(yōu)化等方面發(fā)揮著重要作用,見(jiàn)表6。

4.1 中藥提取工藝與質(zhì)量控制
中藥提取工藝是中藥制備流程中的關(guān)鍵環(huán)節(jié),也是保障中藥質(zhì)量和臨床療效的重要前提。Ma等[97] 為進(jìn)一步優(yōu)化中藥復(fù)方提取工藝參數(shù),以次生代謝產(chǎn)物和多糖的定量核磁、指紋圖譜和分子量等多類(lèi)型數(shù)據(jù)為優(yōu)化目標(biāo),以NSGA-Ⅱ?yàn)榭蚣軜?gòu)建了一個(gè)ML輔助的數(shù)據(jù)驅(qū)動(dòng)型多目標(biāo)優(yōu)化模型。該模型突破了傳統(tǒng)優(yōu)化工藝中只能考察少量指標(biāo)卻需要進(jìn)行大量反復(fù)實(shí)驗(yàn)測(cè)定的瓶頸,為多類(lèi)型指標(biāo)下的中藥高效提取及其智能化工業(yè)生產(chǎn)提供了新的方法和模式。
隨著中藥現(xiàn)代化和國(guó)際化進(jìn)程的加速,中藥質(zhì)量控制的要求不斷提高。Lu 等[98] 通過(guò)對(duì)全過(guò)程質(zhì)量控制策略,基于化學(xué)活性的篩選方法,療效、安全性和一致性的組合策略,以及中醫(yī)藥理論指導(dǎo)方法等進(jìn)行整合,獲得了更全面、精準(zhǔn)的Q-marker。這一研究成果為基于中藥自身特性和原理構(gòu)建新的質(zhì)量控制模式提供了有效支撐。
4.2 中醫(yī)面診和處方推薦
舌象在中醫(yī)臨床醫(yī)學(xué)的診斷和治療中占據(jù)重要地位,基于舌象的辨證是生成中藥處方的重要依據(jù)。因此,基于自動(dòng)構(gòu)建技術(shù)探索舌象與中藥處方的相關(guān)性十分具有研究?jī)r(jià)值。Zhao 等[99] 提出了一種基于圖像編碼器和多標(biāo)簽分類(lèi)的中藥推薦框架,即通過(guò)對(duì)面部和舌象的視覺(jué)診斷,實(shí)現(xiàn)中藥處方的自動(dòng)推薦。結(jié)果表明,通過(guò)利用真實(shí)的面部和舌象圖像進(jìn)行實(shí)驗(yàn),該框架生成了與真實(shí)樣本高度相似的處方數(shù)據(jù)。Hu 等[100]通過(guò)構(gòu)建單/ 雙卷積通道和全連接層的神經(jīng)網(wǎng)絡(luò)模型,模擬中醫(yī)醫(yī)生使用真實(shí)世界的舌象圖像及其對(duì)應(yīng)處方的相關(guān)性,驗(yàn)證了所提出的基于舌象圖像自動(dòng)構(gòu)建中藥處方方法的可行性,并為從更多物理信息中自動(dòng)構(gòu)建中藥處方提供了參考。
4.3 癥狀辨證與體質(zhì)辨證
當(dāng)前,人類(lèi)對(duì)預(yù)防醫(yī)學(xué)和醫(yī)療保健的需求持續(xù)增加。根據(jù)世界衛(wèi)生組織發(fā)布的《世界衛(wèi)生組織傳統(tǒng)醫(yī)學(xué)戰(zhàn)略:2014~2023》(WHO Traditional Medicine Strategy: 2024-2023),世界上80%的人口在一定程度上仍然選擇中醫(yī)藥作為初級(jí)醫(yī)療保健手段[101]。在癥狀辨證研究方面,Jiang等[102] 在臨床專(zhuān)家的幫助下,對(duì)8676 張舌象進(jìn)行了注釋?zhuān)卜譃? 類(lèi),包括裂舌、齒痕舌、瘀舌、斑舌、油膩苔、脫皮苔和爛苔。同時(shí), 利用DL 模型快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(faster region based convolutional neural networks,faster R-CNN) 對(duì)舌象圖像進(jìn)行分類(lèi),揭示了體檢人群的舌頭特征與性別、年齡、代謝性疾病之間的關(guān)系。在體質(zhì)辨證研究方面,Chien 等[103] 基于人口統(tǒng)計(jì)學(xué)和實(shí)驗(yàn)室基礎(chǔ)數(shù)據(jù),采用邏輯回歸、Bayes 和決策樹(shù)等算法,分析并構(gòu)建了代謝綜合征與中醫(yī)體質(zhì)的關(guān)聯(lián)模型,結(jié)果發(fā)現(xiàn),代謝綜合征患者的發(fā)病年齡呈現(xiàn)提前的趨勢(shì);痰濕體質(zhì)在代謝綜合征高危中醫(yī)體質(zhì)分類(lèi)中的占比達(dá)90.6%。未來(lái)該方法有望進(jìn)一步拓展應(yīng)用,包括通過(guò)中醫(yī)體質(zhì)辨證手段對(duì)代謝綜合征進(jìn)行預(yù)測(cè),并為患者推薦個(gè)性化藥物、飲食及護(hù)理方案。
5. AI 賦能數(shù)智中藥開(kāi)發(fā)的“計(jì)算+ 語(yǔ)言”雙模型平臺(tái)
隨著中藥研究的持續(xù)深入,傳統(tǒng)方法在解析中藥復(fù)雜成分和作用機(jī)制方面面臨著巨大挑戰(zhàn),例如,中藥成分復(fù)雜、藥效多樣且作用機(jī)制有待進(jìn)一步明晰;數(shù)智中藥與新藥研發(fā)路徑的銜接仍不清晰,導(dǎo)致中藥研發(fā)效率較低等。因此,業(yè)界迫切需要開(kāi)發(fā)更為先進(jìn)的研究方法,構(gòu)建一個(gè)能夠整合計(jì)算能力和語(yǔ)言理解能力的雙模型平臺(tái)。該平臺(tái)不僅能從多層面分析中藥成分和藥效,提供精準(zhǔn)預(yù)測(cè)和決策支持,還能深入理解和解析中醫(yī)藥理論與現(xiàn)代科學(xué)的內(nèi)在聯(lián)系[104]。
在數(shù)智中藥理念的指引下,數(shù)智本草大模型依托海量的中醫(yī)藥數(shù)據(jù)、基于盤(pán)古大模型構(gòu)建而成,是中醫(yī)藥語(yǔ)言大模型與計(jì)算大模型的有機(jī)融合。其中,中醫(yī)藥數(shù)據(jù)集具備以下關(guān)鍵特點(diǎn):①多樣化數(shù)據(jù)源整合。該數(shù)據(jù)集有效集成了結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)等多種類(lèi)型數(shù)據(jù)。②海量數(shù)據(jù)處理。通過(guò)大規(guī)模數(shù)據(jù)清洗、去重、標(biāo)簽化處理,該數(shù)據(jù)集實(shí)現(xiàn)了對(duì)海量數(shù)據(jù)的有效整合。③ KG 構(gòu)建。基于上述數(shù)據(jù)處理,構(gòu)建了涵蓋中醫(yī)藥實(shí)體數(shù)據(jù)類(lèi)型和多種文本數(shù)據(jù)類(lèi)型的KG。以“ 星斗云”系統(tǒng)中開(kāi)發(fā)的LTM-TCM 中藥智能化數(shù)據(jù)平臺(tái)為例,該平臺(tái)在分子和表型水平上將中醫(yī)與現(xiàn)代醫(yī)學(xué)聯(lián)系起來(lái),是目前世界最大規(guī)模的中藥綜合數(shù)據(jù)庫(kù)[105]。
數(shù)智本草大模型通過(guò)多年數(shù)據(jù)積累和算法優(yōu)化,與天士力自主研發(fā)的“星斗云”系統(tǒng)成功聯(lián)動(dòng),實(shí)現(xiàn)了中藥“計(jì)算+ 語(yǔ)言”雙模型功能。具體而言,中藥語(yǔ)言大模型不僅整合了傳統(tǒng)中醫(yī)藥知識(shí),還融合了現(xiàn)代藥物研發(fā)的先進(jìn)技術(shù),通過(guò)大規(guī)模數(shù)據(jù)集成和KG構(gòu)建,形成了一個(gè)覆蓋中醫(yī)藥領(lǐng)域的綜合性知識(shí)體系,可以實(shí)現(xiàn)在中醫(yī)藥知識(shí)問(wèn)答、疾病方劑報(bào)告、名家開(kāi)方模型構(gòu)建等多個(gè)場(chǎng)景的應(yīng)用。同時(shí),中藥語(yǔ)言大模型可以聯(lián)動(dòng)中藥計(jì)算大模型,實(shí)現(xiàn)天然產(chǎn)物虛擬篩選、結(jié)構(gòu)優(yōu)化和方劑機(jī)制精準(zhǔn)解析等功能,見(jiàn)圖3。例如,基于已有的方劑、已上市的產(chǎn)品,運(yùn)用KG 等技術(shù),針對(duì)“方”形成了藥效組分– 作用靶點(diǎn)– 基因網(wǎng)絡(luò)的中藥數(shù)字化解析方法,中藥計(jì)算大模型已經(jīng)實(shí)現(xiàn)了對(duì)復(fù)方丹參滴丸等中藥制劑作用機(jī)制的數(shù)字化解析,融合真實(shí)世界經(jīng)驗(yàn)與分子機(jī)制,為更精準(zhǔn)挖掘中藥傳統(tǒng)現(xiàn)代理論提供了行業(yè)標(biāo)準(zhǔn)[106]。

數(shù)智本草大模型具有廣泛的應(yīng)用場(chǎng)景,可面向中醫(yī)大夫、中醫(yī)藥專(zhuān)家、藥店店員等用戶(hù)群體,提供問(wèn)診協(xié)助、處方推薦、中醫(yī)藥溯源查詢(xún)、藥物多維篩選、中醫(yī)知識(shí)傳承、經(jīng)驗(yàn)總結(jié)等服務(wù),以提高診療效率與精準(zhǔn)率,實(shí)現(xiàn)診學(xué)研一體化,推動(dòng)中醫(yī)藥事業(yè)的現(xiàn)代化發(fā)展。
6. 討論
因缺乏足夠的科學(xué)證據(jù)支持,中醫(yī)藥在全球范圍內(nèi)的推廣應(yīng)用面臨諸多挑戰(zhàn)。AI 技術(shù)的引入有利于縮小中醫(yī)藥與現(xiàn)代科學(xué)之間的差距,使中醫(yī)藥診療過(guò)程更加定量、客觀和規(guī)范,同時(shí)也為中西醫(yī)結(jié)合診療搭建起了溝通的橋梁。未來(lái)在AI 的幫助下,有望揭示更多關(guān)于中醫(yī)藥療效的科學(xué)證據(jù),并可能形成更為統(tǒng)一的治療指南,特別是在中醫(yī)藥理論的闡釋方面。
盡管AI 在中醫(yī)藥領(lǐng)域的應(yīng)用蘊(yùn)含著前所未有的機(jī)遇,但同樣也帶來(lái)了許多挑戰(zhàn)。例如,在中醫(yī)藥研發(fā)過(guò)程中,仍存在以下難題:①中藥藥效物質(zhì)基礎(chǔ)、作用機(jī)制和理論思維較為復(fù)雜,導(dǎo)致難以精準(zhǔn)預(yù)測(cè)中藥有效成分、藥材特性及功效之間的關(guān)聯(lián),進(jìn)而闡釋中醫(yī)藥的復(fù)雜機(jī)制。②中藥的量效關(guān)系尚不明確,且中藥有效成分的均質(zhì)化問(wèn)題有待解決。③中醫(yī)藥強(qiáng)調(diào)守正創(chuàng)新,即需要在堅(jiān)實(shí)的理論基礎(chǔ)上,提供真實(shí)世界研究信息的支持。然而,中醫(yī)藥典籍浩如煙海,從中提取關(guān)鍵信息難度較大。④中醫(yī)藥研發(fā)人員通常需要經(jīng)過(guò)多年的學(xué)習(xí)與培訓(xùn),才能熟悉中西醫(yī)等多領(lǐng)域、多學(xué)科知識(shí)等。
針對(duì)上述問(wèn)題,可采取以下策略:①利用系統(tǒng)藥理學(xué)和ML等方法,對(duì)中醫(yī)藥典籍進(jìn)行向量化處理,建立標(biāo)準(zhǔn)化、高質(zhì)量的中藥數(shù)據(jù)庫(kù);基于KG 構(gòu)建中藥成分- 靶點(diǎn)- 疾病多尺度網(wǎng)絡(luò)關(guān)系,以揭示中藥復(fù)方多成分、多靶點(diǎn)、多通路作用模式的核心內(nèi)涵。②利用真實(shí)世界研究收集和分析中醫(yī)藥在實(shí)際臨床應(yīng)用中的數(shù)據(jù),然后基于AI 模型和算法實(shí)現(xiàn)對(duì)中藥方劑有效性和安全性的更精準(zhǔn)預(yù)測(cè)。③在中醫(yī)GPT 問(wèn)答系統(tǒng)中,優(yōu)化人機(jī)交互設(shè)計(jì),提升用戶(hù)體驗(yàn),以增強(qiáng)中醫(yī)藥研發(fā)人員對(duì)中醫(yī)藥知識(shí)的了解和熱愛(ài)。
7. 結(jié)語(yǔ)
本文分析梳理了現(xiàn)階段AI 技術(shù)在中醫(yī)藥研發(fā)及產(chǎn)業(yè)化中的應(yīng)用情況,筆者認(rèn)為AI 作為中醫(yī)藥與現(xiàn)代醫(yī)學(xué)之間橋梁的重要作用已經(jīng)凸顯。相關(guān)技術(shù)的發(fā)展為后續(xù)深入探索AI 在中醫(yī)藥數(shù)智化與實(shí)踐中的發(fā)展方向和策略提供了寶貴的新見(jiàn)解。盡管AI 為中醫(yī)藥帶來(lái)了革命性的機(jī)遇,但其在應(yīng)用于中醫(yī)藥領(lǐng)域時(shí)仍面臨一系列挑戰(zhàn)。因此,研究者應(yīng)加大力度開(kāi)發(fā)適用于中醫(yī)藥行業(yè)的技術(shù)和算法,推動(dòng)中醫(yī)藥的數(shù)智化、現(xiàn)代化進(jìn)程,從而為公眾提供更優(yōu)質(zhì)的醫(yī)療保健服務(wù)。
引用本文
郭鵬飛,魏宇,楊鵬程,趙倩,雷瑋華,胡蘊(yùn)慧,王文佳*.人工智能賦能的現(xiàn)代中藥數(shù)智化研究進(jìn)展[J].中國(guó)食品藥品監(jiān)管.2025.4(255):20-39.

來(lái)源:中國(guó)食品藥品監(jiān)管雜志