中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

您當(dāng)前的位置:檢測(cè)資訊 > 科研開(kāi)發(fā)

大語(yǔ)言模型在藥品監(jiān)管中的應(yīng)用實(shí)踐與思考

嘉峪檢測(cè)網(wǎng)        2025-04-05 16:59

摘  要Abstract 

 

近年來(lái)人工智能(AI),尤其是大語(yǔ)言模型技術(shù)的快速發(fā)展,為藥品監(jiān)管領(lǐng)域帶來(lái)了新的機(jī)遇與挑戰(zhàn)。本文結(jié)合國(guó)家藥監(jiān)局信息中心的初步實(shí)踐,探討了藥品監(jiān)管領(lǐng)域應(yīng)用大語(yǔ)言模型的基礎(chǔ)考量,提出了一體化建設(shè)框架與實(shí)踐路徑。文章首先分析了數(shù)據(jù)、算力和算法三大基礎(chǔ)要素的重要性,梳理了數(shù)據(jù)質(zhì)量、算力成本和算法適用性在模型應(yīng)用中的關(guān)鍵作用;提出了一體化建設(shè)框架,建議通過(guò)國(guó)家與省級(jí)藥品監(jiān)管部門的協(xié)同合作,構(gòu)建統(tǒng)一且可擴(kuò)展的大語(yǔ)言模型應(yīng)用體系,避免重復(fù)建設(shè)和資源浪費(fèi);最后展示了大語(yǔ)言模型在藥品注冊(cè)形式審查場(chǎng)景中的具體案例及實(shí)際應(yīng)用成效,并展望了未來(lái)藥品監(jiān)管大語(yǔ)言模型在智能化水平、安全性、合作平臺(tái)和個(gè)性化服務(wù)開(kāi)發(fā)等方面的發(fā)展前景。

 

In recent years, the rapid development of artificial intelligence (AI) technology, particularly large language models (LLMs), has brought new opportunities and challenges to the field of drug regulation. This paper, based on the preliminary practices of the Center for Information, NMPA, explores the fundamental considerations for applying LLMs in drug regulation and proposes an integrated construction framework and practical pathways. The article first analyzes the importance of three foundational elements: data, computing power, and algorithms, emphasizing the critical roles of data quality, computing cost, and algorithm suitability in model applications. Next, it proposes an integrated construction framework, suggesting collaborative efforts between national and provincial drug regulatory authorities to build a unified and scalable LLM application system that avoids redundant construction and resource waste. Finally, through a case study on the intelligent review of drug registration documents, the paper demonstrates the practical outcomes of LLM applications and envisions future developments in intelligent systems, safety measures, collaborative platforms, and personalized service development in drug regulation.

 

關(guān)鍵詞 Key words

 

藥品監(jiān)管;人工智能;大語(yǔ)言模型;一體化建設(shè)框架;實(shí)踐案例

 

drug regulation; artificial intelligence; large language model; integrated construction framework; case study

 

近年來(lái),人工智能(artificial intelligence,AI), 尤其是大語(yǔ)言模型技術(shù)快速發(fā)展,已成為推動(dòng)各行各業(yè)創(chuàng)新和生態(tài)系統(tǒng)重塑的強(qiáng)大動(dòng)力,為相關(guān)領(lǐng)域發(fā)展注入了無(wú)限可能性。在藥品監(jiān)管領(lǐng)域,國(guó)家藥監(jiān)局率先印發(fā)了《藥品監(jiān)管人工智能典型應(yīng)用場(chǎng)景清單》[1],明確了15 個(gè)重點(diǎn)應(yīng)用場(chǎng)景。與此同時(shí),相關(guān)部門也正在嘗試推動(dòng)AI 技術(shù)與核心信息系統(tǒng)的深度融合,通過(guò)AI 技術(shù)重構(gòu)現(xiàn)有系統(tǒng),以實(shí)現(xiàn)藥品監(jiān)管業(yè)務(wù)智能化升級(jí)。為高效穩(wěn)妥推進(jìn)這一進(jìn)程,并避免重復(fù)建設(shè)和資源浪費(fèi),不僅需要鼓勵(lì)相關(guān)部門勇于探索,更需要在國(guó)家層面進(jìn)行精心規(guī)劃和設(shè)計(jì),并指導(dǎo)各級(jí)藥品監(jiān)管部門有序?qū)嵺`?;诖?,本文結(jié)合國(guó)家藥監(jiān)局信息中心推進(jìn)大語(yǔ)言模型應(yīng)用的初步實(shí)踐,分析藥品監(jiān)管領(lǐng)域應(yīng)用大語(yǔ)言模型所需的基礎(chǔ)考量,初步提出了藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)框架與實(shí)踐路徑,并通過(guò)案例展示實(shí)際應(yīng)用成效,以期為系統(tǒng)推進(jìn)藥品監(jiān)管領(lǐng)域大語(yǔ)言模型應(yīng)用研究和實(shí)踐提供有益參考。

 

1. 藥品監(jiān)管大語(yǔ)言模型應(yīng)用的基礎(chǔ)考量

 

1.1 科學(xué)理性看待大語(yǔ)言模型的技術(shù)應(yīng)用

 

大語(yǔ)言模型是AI 領(lǐng)域的一項(xiàng)突破,它利用具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行高級(jí)語(yǔ)言處理。通過(guò)自監(jiān)督學(xué)習(xí)技術(shù),這些模型能夠處理和理解人類語(yǔ)言或文本。其核心是變換器(Transformer)架構(gòu),這使得模型在分析一句話時(shí)可以同時(shí)考慮所有單詞,從而更準(zhǔn)確地理解整句話的意思,而不僅僅是單獨(dú)解析每個(gè)單詞。這種能力讓大語(yǔ)言模型在各種自然語(yǔ)言處理任務(wù)中表現(xiàn)出色[2]。

 

大語(yǔ)言模型技術(shù)在海量數(shù)據(jù)處理、智能分析預(yù)測(cè)以及自動(dòng)化決策支持等方面已展現(xiàn)出強(qiáng)大的能力[3]。隨著技術(shù)不斷發(fā)展,算力價(jià)格會(huì)持續(xù)降低,高性能計(jì)算資源將變得越來(lái)越普及且容易獲取[4] ;模型算法和模型訓(xùn)練工程化方法也在不斷優(yōu)化,大語(yǔ)言模型智能化水平和運(yùn)行效率將持續(xù)提升。在AI 應(yīng)用治理體系不斷完善的背景下,大語(yǔ)言模型技術(shù)在提升藥品監(jiān)管科學(xué)性和效率方面的潛力不可忽視。

 

毋容置疑,目前大語(yǔ)言模型技術(shù)及應(yīng)用仍處于早期探索階段。由于技術(shù)成熟度、數(shù)據(jù)質(zhì)量、使用成本等多因素的影響, 大語(yǔ)言模型應(yīng)用存在多方面風(fēng)險(xiǎn)[5] :①技術(shù)安全風(fēng)險(xiǎn),包括提示注入、數(shù)據(jù)泄漏、不完善的沙盒隔離等。②數(shù)據(jù)隱私與安全風(fēng)險(xiǎn),例如,用戶數(shù)據(jù)被用于訓(xùn)練導(dǎo)致隱私信息泄露、模型和數(shù)據(jù)成為核心資產(chǎn)安全保護(hù)難度提升等。③倫理與法律風(fēng)險(xiǎn),例如,算法偏見(jiàn)與歧視、模型輸出錯(cuò)誤或虛假信息等。

 

在藥品監(jiān)管領(lǐng)域, 不應(yīng)受“ALL in AI”等輿論導(dǎo)向的影響[6]、盲目追求技術(shù)潮流,而應(yīng)秉持科學(xué)和理性的態(tài)度,緊密結(jié)合大語(yǔ)言模型的技術(shù)特性、自身實(shí)際需求以及風(fēng)險(xiǎn)容忍度,進(jìn)行審慎評(píng)估與規(guī)劃,確保大語(yǔ)言模型技術(shù)的應(yīng)用能夠切實(shí)服務(wù)于藥品監(jiān)管效能提升。

 

1.2 高度重視大語(yǔ)言模型技術(shù)應(yīng)用的三大基礎(chǔ)

 

在藥品監(jiān)管領(lǐng)域應(yīng)用大語(yǔ)言模型技術(shù),必須對(duì)支撐其應(yīng)用的三大基礎(chǔ)(數(shù)據(jù)、算力和算法)具有充分的認(rèn)識(shí)和準(zhǔn)備。在結(jié)合具體應(yīng)用場(chǎng)景探討技術(shù)細(xì)節(jié)之前,需對(duì)數(shù)據(jù)質(zhì)量、算力需求以及算法適用性進(jìn)行全面評(píng)估,才能確保項(xiàng)目的有效實(shí)施和高效運(yùn)行。

 

1.2.1 數(shù)據(jù)基礎(chǔ)

 

數(shù)據(jù)是大語(yǔ)言模型的基石,其覆蓋率、質(zhì)量、規(guī)范程度以及與應(yīng)用的適配度,直接關(guān)系到大語(yǔ)言模型的應(yīng)用效果和服務(wù)質(zhì)量[7]。當(dāng)前,AI 語(yǔ)料相關(guān)企業(yè)不斷涌現(xiàn),多家互聯(lián)網(wǎng)巨頭以及Scale AI 等獨(dú)角獸企業(yè)提供的大規(guī)模、高精度AI 數(shù)據(jù)集服務(wù)受到資本市場(chǎng)的高度認(rèn)可與追捧,充分彰顯了高質(zhì)量數(shù)據(jù)對(duì)于AI 發(fā)展的重要性。

 

藥品監(jiān)管數(shù)據(jù)涉及大量業(yè)務(wù)數(shù)據(jù)、法律法規(guī)和專業(yè)知識(shí)等,具備較高的語(yǔ)義復(fù)雜性和領(lǐng)域特異性[8]。大語(yǔ)言模型技術(shù)在藥品監(jiān)管領(lǐng)域的應(yīng)用依賴于這些專業(yè)信息和業(yè)務(wù)數(shù)據(jù)。專業(yè)、高質(zhì)量的數(shù)據(jù)不僅是構(gòu)建有效模型的前提,也是確保模型準(zhǔn)確性的重要保障。使用質(zhì)量參差不齊的數(shù)據(jù),將導(dǎo)致大語(yǔ)言模型的訓(xùn)練效果大打折扣,進(jìn)而影響其在實(shí)際應(yīng)用中的表現(xiàn)。為保障數(shù)據(jù)的質(zhì)量,必須制定相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,按要求對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理,對(duì)非結(jié)構(gòu)化數(shù)據(jù)(例如,臨床試驗(yàn)報(bào)告、藥品說(shuō)明書(shū)等)進(jìn)行數(shù)據(jù)標(biāo)注,并持續(xù)開(kāi)展數(shù)據(jù)質(zhì)量評(píng)估與驗(yàn)證。

 

1.2.2 算力基礎(chǔ)

 

在開(kāi)展藥品監(jiān)管大語(yǔ)言模型應(yīng)用前,必須對(duì)大語(yǔ)言模型所需算力的規(guī)模有清晰的認(rèn)知。大語(yǔ)言模型結(jié)構(gòu)相對(duì)復(fù)雜,動(dòng)輒數(shù)十億甚至數(shù)千億個(gè)參數(shù),訓(xùn)練和推理過(guò)程都需要強(qiáng)大的算力資源支持, 包括高性能的圖形處理器(graphics processing unit,GPU) 或張量處理器(tensor processing unit,TPU) 集群,這些設(shè)備能夠提供足夠的并行計(jì)算能力,以加速模型訓(xùn)練過(guò)程,高效進(jìn)行推理應(yīng)用。然而,近年來(lái)全球算力資源緊缺且價(jià)格昂貴,盡管DeepSeek 相關(guān)研究成果已顯著降低了大語(yǔ)言模型使用的算力成本[9],如深圳市政務(wù)云、江西省贛州市政務(wù)服務(wù)和數(shù)據(jù)管理局等在政務(wù)大模型應(yīng)用方面,通過(guò)采用DeepSeek 技術(shù), 成功將搭建與部署的成本降低至其他模型方案的十分之一[10],但藥品監(jiān)管部門在開(kāi)展藥品監(jiān)管大語(yǔ)言模型應(yīng)用時(shí)仍需要關(guān)注算力成本問(wèn)題。為了應(yīng)對(duì)這一挑戰(zhàn),項(xiàng)目設(shè)計(jì)初期必須結(jié)合應(yīng)用場(chǎng)景對(duì)算力需求進(jìn)行詳細(xì)的預(yù)算規(guī)劃。評(píng)估不同階段的算力消耗,并采取相應(yīng)的優(yōu)化措施,例如,利用第三方云資源訓(xùn)練,采用模型剪枝、量化等技術(shù)手段,以減少算力開(kāi)銷。

 

1.2.3 算法基礎(chǔ)

 

在藥品監(jiān)管領(lǐng)域應(yīng)用大語(yǔ)言模型時(shí),還需要對(duì)所使用大語(yǔ)言模型的算法基礎(chǔ)具有一定的認(rèn)知。模型參數(shù)量以及是否量化是一個(gè)關(guān)鍵因素。較大的非量化模型通常具有更高的表達(dá)能力和更強(qiáng)的泛化能力,但也意味著更高的算力成本和更長(zhǎng)的計(jì)算時(shí)間[11]。因此,在選擇模型時(shí)需要結(jié)合業(yè)務(wù)場(chǎng)景的實(shí)際情況,權(quán)衡模型大小與實(shí)際需求之間的關(guān)系,使大語(yǔ)言模型能夠在實(shí)際應(yīng)用中更加高效、準(zhǔn)確地運(yùn)行。

 

不同的應(yīng)用場(chǎng)景對(duì)知識(shí)庫(kù)以及輸出樣式有著不同的需求,因此需要根據(jù)具體的應(yīng)用需求,選擇經(jīng)過(guò)精調(diào)后的子領(lǐng)域模型。例如,在處理不良反應(yīng)報(bào)告時(shí),需要引入特定領(lǐng)域知識(shí)和規(guī)則,以增強(qiáng)模型的理解和預(yù)測(cè)能力[12] ;而在進(jìn)行藥品監(jiān)管風(fēng)險(xiǎn)預(yù)警時(shí),則需要針對(duì)模型輸出內(nèi)容的邏輯性與可解釋性進(jìn)行優(yōu)化,以提升模型決策結(jié)果的可信度,使其更符合實(shí)際應(yīng)用的需要。

 

1.3 合理規(guī)避大語(yǔ)言模型技術(shù)應(yīng)用風(fēng)險(xiǎn)

 

在藥品監(jiān)管領(lǐng)域應(yīng)用大語(yǔ)言模型技術(shù)時(shí),需要基于對(duì)應(yīng)用風(fēng)險(xiǎn)的深入了解,評(píng)估是否使用大語(yǔ)言模型,并選擇合適的模型部署方式和服務(wù)開(kāi)放范圍[13]。

 

1.3.1 數(shù)據(jù)安全

 

藥品監(jiān)管在保障和促進(jìn)公眾健康中發(fā)揮重要作用,該領(lǐng)域相關(guān)數(shù)據(jù)價(jià)值高、行政敏感度高[14],因此數(shù)據(jù)安全是藥品監(jiān)管大語(yǔ)言模型必須堅(jiān)守的底線。在數(shù)據(jù)采集和存儲(chǔ)階段,應(yīng)嚴(yán)格遵守《中華人民共和國(guó)個(gè)人信息保護(hù)法》,確保數(shù)據(jù)的匿名化和脫敏處理,避免個(gè)人隱私和敏感信息的泄露。在數(shù)據(jù)傳輸和使用過(guò)程中,應(yīng)遵守《中華人民共和國(guó)網(wǎng)絡(luò)安全法》,采用技術(shù)手段,防止數(shù)據(jù)在傳輸過(guò)程中被截取或?yàn)E用。

 

在模擬訓(xùn)練和推理過(guò)程中,數(shù)據(jù)安全同樣至關(guān)重要。大語(yǔ)言模型的訓(xùn)練需要海量數(shù)據(jù),這些數(shù)據(jù)可能包含敏感信息。因此,需要在數(shù)據(jù)預(yù)處理階段進(jìn)行嚴(yán)格的篩選和過(guò)濾,避免敏感數(shù)據(jù)進(jìn)入訓(xùn)練集,防止在后續(xù)推理階段出現(xiàn)敏感數(shù)據(jù)泄露的風(fēng)險(xiǎn)。

 

模型的部署方式需要根據(jù)實(shí)際需求謹(jǐn)慎選擇。如果服務(wù)范圍涉及敏感數(shù)據(jù)或?qū)Π踩砸筝^高,應(yīng)優(yōu)先考慮本地化部署或私有云部署,以最大限度減少數(shù)據(jù)外泄的風(fēng)險(xiǎn)。對(duì)于必須使用公有云部署并面向互聯(lián)網(wǎng)用戶提供服務(wù)的情況,應(yīng)選擇符合GB/T31168-2023《信息安全技術(shù) 云計(jì)算服務(wù)安全能力要求》、YD/T3157-2016《公有云服務(wù)安全防護(hù)要求》、GB/T 22239-2019《信息安全技術(shù) 網(wǎng)絡(luò)安全等級(jí)保護(hù)基本要求》等標(biāo)準(zhǔn)的云服務(wù)提供商,并確保其具備完善的數(shù)據(jù)加密、訪問(wèn)控制和合規(guī)性保障措施。

 

1.3.2 服務(wù)質(zhì)量

 

藥品監(jiān)管大語(yǔ)言模型應(yīng)用需遵守《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》,有效應(yīng)對(duì)大語(yǔ)言模型“幻覺(jué)”和算法偏見(jiàn)的問(wèn)題,保障算法透明、公平、可解釋,從而保證藥品監(jiān)管AI 服務(wù)的質(zhì)量。

 

大語(yǔ)言模型有時(shí)會(huì)產(chǎn)生“幻覺(jué)”,即生成的信息看似合理,但實(shí)際上并不準(zhǔn)確,或其實(shí)是虛構(gòu)的內(nèi)容[15]。雖然采用檢索增強(qiáng)生成(retrieval-augmented generation,RAG)技術(shù)在限定范圍的知識(shí)庫(kù)內(nèi)檢索生成答案[16]并建立有效的反饋機(jī)制,使用戶能夠報(bào)告不準(zhǔn)確信息并定期更新模型,有利于減少“幻覺(jué)”的發(fā)生概率,但在藥品監(jiān)管這一敏感且高度專業(yè)化的領(lǐng)域,“幻覺(jué)”的發(fā)生尤為危險(xiǎn),錯(cuò)誤的信息可能導(dǎo)致嚴(yán)重的后果。

 

算法偏見(jiàn)是指由于訓(xùn)練數(shù)據(jù)集存在偏差,模型在某些情況下表現(xiàn)出不公平的現(xiàn)象,例如對(duì)特定人群、地區(qū)、藥品或適應(yīng)癥類型的處理不夠公正,模型的輸出包含歧視性內(nèi)容或違背社會(huì)倫理價(jià)值觀的觀點(diǎn)。雖然通過(guò)優(yōu)化訓(xùn)練數(shù)據(jù)及訓(xùn)練過(guò)程、進(jìn)行安全對(duì)齊并定期審查模型輸出等方式可以緩解這類問(wèn)題[17],但算法偏見(jiàn)仍是服務(wù)質(zhì)量方面的一個(gè)重要考量因素。

 

因此,在藥品監(jiān)管領(lǐng)域引入大語(yǔ)言模型技術(shù)時(shí),需要對(duì)應(yīng)用場(chǎng)景所能承受的風(fēng)險(xiǎn)程度進(jìn)行評(píng)估,并采取相應(yīng)的措施來(lái)降低這種風(fēng)險(xiǎn)。

 

2. 藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)框架及實(shí)踐路徑

 

為統(tǒng)籌推進(jìn)全國(guó)藥品監(jiān)管系統(tǒng)大語(yǔ)言模型應(yīng)用,避免重復(fù)建設(shè)和資源浪費(fèi),本研究提出了一體化建設(shè)框架和實(shí)踐路徑。

 

2.1 藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)框架

 

藥品監(jiān)管大語(yǔ)言模型的一體化建設(shè)框架是指在國(guó)家與省級(jí)藥品監(jiān)管部門的協(xié)同合作下,構(gòu)建高效、統(tǒng)一且可擴(kuò)展的大語(yǔ)言模型應(yīng)用體系(圖1)。該框架采用“統(tǒng)建共用、分層細(xì)化”的設(shè)計(jì)理念,即國(guó)家藥監(jiān)局的信息化部門負(fù)責(zé)基礎(chǔ)模型、主領(lǐng)域模型以及子領(lǐng)域模型的統(tǒng)一建設(shè)與管理,國(guó)家與省級(jí)藥品監(jiān)管業(yè)務(wù)部門基于主領(lǐng)域模型、子領(lǐng)域模型進(jìn)行精調(diào)或采取量化、剪枝、蒸餾等技術(shù),構(gòu)建輕量級(jí)專屬應(yīng)用模型[18]。這一模式能夠避免各地藥品監(jiān)管部門“重復(fù)造輪子”的現(xiàn)象,減少不必要的資源投入,解決技術(shù)質(zhì)量參差不齊等問(wèn)題,以此提升全國(guó)藥品監(jiān)管系統(tǒng)的整體效能。

 

2.1.1 統(tǒng)建共用部分

 

國(guó)家藥監(jiān)局的信息化部門負(fù)責(zé)基礎(chǔ)模型、主領(lǐng)域模型和核心子領(lǐng)域模型的統(tǒng)一建設(shè)。作為整個(gè)框架的基石, 基礎(chǔ)模型通常采用混合專家(mixture of experts,MoE) 框架。該框架具備強(qiáng)大的通用性和擴(kuò)展性,能夠處理復(fù)雜的自然語(yǔ)言處理任務(wù)。通過(guò)MoE 框架,基礎(chǔ)模型能夠在大規(guī)模參數(shù)量的情況下保持高效的計(jì)算性能,為后續(xù)應(yīng)用提供堅(jiān)實(shí)的技術(shù)支撐[19]。主領(lǐng)域模型則是基于基礎(chǔ)模型,結(jié)合藥品監(jiān)管領(lǐng)域的特定數(shù)據(jù)進(jìn)行精調(diào)(fine-tuning),形成適用于藥品監(jiān)管垂直領(lǐng)域的核心模型。通過(guò)精調(diào)技術(shù),模型在深入學(xué)習(xí)藥品監(jiān)管領(lǐng)域的專業(yè)知識(shí)后,能夠更有效地理解和處理相關(guān)任務(wù),特別是在專業(yè)術(shù)語(yǔ)和法規(guī)條款的理解方面有了顯著提升[20]。國(guó)家藥監(jiān)局相關(guān)直屬單位,針對(duì)特定專業(yè)業(yè)務(wù)場(chǎng)景(例如,藥品審評(píng)審批、不良反應(yīng)監(jiān)測(cè)、監(jiān)督檢查等),對(duì)主領(lǐng)域模型進(jìn)行微調(diào),構(gòu)建針對(duì)關(guān)鍵業(yè)務(wù)場(chǎng)景的核心子領(lǐng)域模型,以更精準(zhǔn)服務(wù)于藥品監(jiān)管各核心專業(yè)領(lǐng)域的具體需求。

 

主領(lǐng)域和核心子領(lǐng)域模型的統(tǒng)一部署,確保了全國(guó)范圍內(nèi)的藥品監(jiān)管系統(tǒng)能夠共享同一套高質(zhì)量的基礎(chǔ)模型,有效避免了重復(fù)建設(shè)和資源浪費(fèi)。通過(guò)這種一體化建設(shè)模式,各級(jí)藥品監(jiān)管部門可以在統(tǒng)一的技術(shù)框架下開(kāi)展本地化應(yīng)用,實(shí)現(xiàn)技術(shù)互通、生態(tài)整合和資源共享,全面提升藥品監(jiān)管工作的智能化水平和協(xié)同效率。

 

2.1.2 分層細(xì)化部分

 

在統(tǒng)建共用部分的基礎(chǔ)上,國(guó)家與省級(jí)藥品監(jiān)管業(yè)務(wù)部門根據(jù)自身的業(yè)務(wù)需求和應(yīng)用場(chǎng)景,進(jìn)一步細(xì)化模型,構(gòu)建具體的應(yīng)用模型?;谥黝I(lǐng)域模型和子領(lǐng)域模型構(gòu)建應(yīng)用模型過(guò)程中,主要采用蒸餾技術(shù)。國(guó)家與省級(jí)藥品監(jiān)管業(yè)務(wù)部門可以通過(guò)蒸餾技術(shù)從主領(lǐng)域模型和子領(lǐng)域模型中提取關(guān)鍵知識(shí),并將其壓縮到規(guī)模更小但性能優(yōu)異的輕量化模型中,使模型能夠在邊緣設(shè)備或本地服務(wù)器上快速運(yùn)行,從而更好地適應(yīng)地方監(jiān)管工作的實(shí)時(shí)性和靈活性要求[21]。

 

2.1.3 資源共享機(jī)制

 

藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)框架的資源共享機(jī)制貫穿基礎(chǔ)模型、主領(lǐng)域模型、子領(lǐng)域模型以及模型應(yīng)用的各個(gè)層級(jí)。模型參數(shù)、數(shù)據(jù)集、模型服務(wù)和模型應(yīng)用等各類資源的共享有利于實(shí)現(xiàn)資源的高效利用。這種共享機(jī)制能夠減少重復(fù)建設(shè),降低開(kāi)發(fā)和運(yùn)維成本,有助于成果的應(yīng)用和推廣,從而全面提升全國(guó)藥品監(jiān)管系統(tǒng)的整體效能和智能化水平。

 

2.2 藥品監(jiān)管大語(yǔ)言模型實(shí)踐路徑

 

當(dāng)前,各級(jí)藥品監(jiān)管部門正在積極探索大語(yǔ)言模型技術(shù)的應(yīng)用,并逐步將其引入日常監(jiān)管工作中,但與一體化建設(shè)框架的目標(biāo)相比仍存在一定差距。為確保未來(lái)能以較低成本切換到一體化建設(shè)框架并實(shí)現(xiàn)無(wú)縫對(duì)接,各級(jí)藥品監(jiān)管部門應(yīng)在現(xiàn)有實(shí)踐中,將大語(yǔ)言模型應(yīng)用探索的相關(guān)工作置于一體化建設(shè)框架中的對(duì)應(yīng)位置,以確保順利過(guò)渡。

 

2.2.1 漸進(jìn)式一體化建設(shè)路徑

 

在當(dāng)前的實(shí)踐中,各級(jí)藥品監(jiān)管部門可以根據(jù)自身的業(yè)務(wù)需求,先行構(gòu)建自有領(lǐng)域模型,并將其應(yīng)用于具體的監(jiān)管工作中。這些自有領(lǐng)域模型可以作為未來(lái)子領(lǐng)域模型的基礎(chǔ),在經(jīng)過(guò)效果評(píng)估和應(yīng)用驗(yàn)證后,可逐步升級(jí)為子領(lǐng)域模型。通過(guò)這種方式,各級(jí)藥品監(jiān)管部門可以在現(xiàn)有工作基礎(chǔ)上,逐步向一體化建設(shè)框架靠攏。這種逐步升級(jí)的方式不僅能夠確保模型的實(shí)用性,還能為一體化建設(shè)全局賦能奠定基礎(chǔ)。

 

2.2.2 標(biāo)準(zhǔn)化與模塊化設(shè)計(jì)

 

各級(jí)藥品監(jiān)管部門在建設(shè)初期就應(yīng)高度重視標(biāo)準(zhǔn)化與模塊化設(shè)計(jì)。通過(guò)統(tǒng)一接口標(biāo)準(zhǔn),確保系統(tǒng)間的兼容性與互操作性,有效減少技術(shù)差異給漸進(jìn)式一體化框架融合帶來(lái)的障礙。采用模塊化設(shè)計(jì),將復(fù)雜功能分解為獨(dú)立模塊,便于開(kāi)發(fā)、維護(hù)和靈活調(diào)用,同時(shí)降低未來(lái)切換到一體化建設(shè)框架的成本。

 

2.2.3 構(gòu)建協(xié)同創(chuàng)新平臺(tái),加速一體化建設(shè)進(jìn)展

 

各級(jí)藥品監(jiān)管部門聯(lián)合高校與科研機(jī)構(gòu)、大語(yǔ)言模型算法企業(yè)以及AI 算力企業(yè)等,共同構(gòu)建一個(gè)協(xié)同創(chuàng)新平臺(tái),是加速藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)進(jìn)展的可行舉措。該平臺(tái)旨在推動(dòng)各方資源的深度融合與高效協(xié)作,為各級(jí)藥品監(jiān)管部門的大語(yǔ)言模型應(yīng)用提供統(tǒng)一且通用的數(shù)據(jù)基礎(chǔ)設(shè)施、大語(yǔ)言模型算法服務(wù)以及算力支持。借助這一平臺(tái),不僅可以有效整合各方優(yōu)勢(shì)資源,促進(jìn)技術(shù)創(chuàng)新和經(jīng)驗(yàn)共享,還能通過(guò)統(tǒng)一的技術(shù)指導(dǎo)以及一致的技術(shù)選型,降低現(xiàn)有系統(tǒng)向一體化建設(shè)框架切換的成本,從而顯著加快藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)進(jìn)程。

 

3. 藥品監(jiān)管大語(yǔ)言模型應(yīng)用初步實(shí)踐

 

依據(jù)藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)框架,國(guó)家藥監(jiān)局信息中心在業(yè)務(wù)場(chǎng)景應(yīng)用落地方面已進(jìn)行初步探索與實(shí)踐,并在藥品注冊(cè)形式審查場(chǎng)景中取得了積極進(jìn)展。通過(guò)將大語(yǔ)言模型技術(shù)與藥品注冊(cè)管理系統(tǒng)深度融合(圖2),初步實(shí)現(xiàn)了對(duì)申報(bào)材料的智能化審核,提升了形式審查工作的效率與準(zhǔn)確性。

3.1 需求與目標(biāo)

 

在大語(yǔ)言模型引入之前,藥品注冊(cè)形式審查工作面臨諸多挑戰(zhàn),包括法律法規(guī)的復(fù)雜性、申報(bào)材料的多樣性、數(shù)據(jù)驗(yàn)證的繁瑣性以及審查標(biāo)準(zhǔn)不一致等。這些挑戰(zhàn)不僅增加了審查工作的難度,也在一定程度上影響了工作效率和質(zhì)量,將大語(yǔ)言模型技術(shù)引入藥品注冊(cè)形式審查工作成為一種必要且有效的解決方案。利用大語(yǔ)言模型強(qiáng)大的自然語(yǔ)言處理能力和智能化分析功能,可以顯著提升審查工作的效率與準(zhǔn)確性,同時(shí)促進(jìn)審查標(biāo)準(zhǔn)的統(tǒng)一化,有效解決工作中的痛點(diǎn)。

 

3.2 實(shí)施步驟

 

大語(yǔ)言模型在藥品注冊(cè)形式審查應(yīng)用場(chǎng)景的落地實(shí)施分為知識(shí)庫(kù)建設(shè)、精調(diào)模型、系統(tǒng)集成和測(cè)試4 個(gè)步驟。

 

3.2.1 知識(shí)庫(kù)建設(shè)

 

知識(shí)庫(kù)建設(shè)是保證大語(yǔ)言模型在藥品注冊(cè)形式審查場(chǎng)景中成功落地的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是為模型提供全面、準(zhǔn)確的藥品注冊(cè)相關(guān)領(lǐng)域知識(shí)支持。這一過(guò)程專注于收集包括《藥品注冊(cè)管理辦法》在內(nèi)與藥品注冊(cè)直接相關(guān)的法律法規(guī)、標(biāo)準(zhǔn)文件以及技術(shù)指南等,通過(guò)深度加工和向量化存儲(chǔ),確保大語(yǔ)言模型能夠準(zhǔn)確理解和高效應(yīng)用這些規(guī)則,最大限度減少無(wú)關(guān)信息干擾。其中,向量化存儲(chǔ)技術(shù)不僅保留了原始文本的語(yǔ)義信息,還具備較強(qiáng)的泛化能力,可幫助模型快速檢索和匹配藥品注冊(cè)相關(guān)知識(shí)[22]。

 

此外,知識(shí)庫(kù)內(nèi)容定期更新,確保始終與最新的藥品注冊(cè)相關(guān)法律法規(guī)、標(biāo)準(zhǔn)文件和技術(shù)指南等保持一致,可有效避免因知識(shí)滯后導(dǎo)致的誤判風(fēng)險(xiǎn)。

 

3.2.2 精調(diào)模型

 

為了確保藥品監(jiān)管主領(lǐng)域大語(yǔ)言模型能夠更好地適配藥品注冊(cè)形式審查的具體需求,有必要對(duì)模型進(jìn)行精調(diào),即通過(guò)引入藥品注冊(cè)申報(bào)材料樣本、歷史審查記錄等包含標(biāo)記的業(yè)務(wù)數(shù)據(jù),對(duì)基礎(chǔ)模型進(jìn)行針對(duì)性訓(xùn)練,使其具備更強(qiáng)的領(lǐng)域知識(shí)理解能力。例如,將已通過(guò)審查的申報(bào)材料作為正例,未通過(guò)的材料作為反例,標(biāo)注其不符合要求的具體原因(包括材料缺失、格式錯(cuò)誤或違反特定法規(guī)等)。這種帶有明確標(biāo)簽的歷史數(shù)據(jù)能夠顯著提升模型在實(shí)際任務(wù)中的判斷準(zhǔn)確性,特別是在藥品注冊(cè)材料完整性檢查和合規(guī)性判斷方面。此外,需要對(duì)比精調(diào)前后模型的表現(xiàn),評(píng)估其在準(zhǔn)確率、召回率等方面的提升效果,確保模型能夠滿足實(shí)際業(yè)務(wù)需求。通過(guò)精調(diào)模型,大語(yǔ)言模型在藥品注冊(cè)形式審查場(chǎng)景中的表現(xiàn)得到了顯著改善,包括對(duì)申報(bào)材料的理解能力有所提高,在復(fù)雜規(guī)則下的判斷準(zhǔn)確性有所增強(qiáng)等。

 

3.2.3 系統(tǒng)集成

 

將大語(yǔ)言模型與現(xiàn)有的藥品注冊(cè)管理系統(tǒng)進(jìn)行深度集成的核心在于確保大語(yǔ)言模型能夠高效、準(zhǔn)確地對(duì)電子化申報(bào)材料進(jìn)行智能判斷和比對(duì)。

 

首先對(duì)現(xiàn)有藥品注冊(cè)管理系統(tǒng)的接口進(jìn)行全面分析,以確定如何最優(yōu)地將大語(yǔ)言模型嵌入到當(dāng)前的工作流中;進(jìn)行自動(dòng)化或半自動(dòng)化升級(jí),實(shí)現(xiàn)在填寫申報(bào)內(nèi)容時(shí),調(diào)用大語(yǔ)言模型應(yīng)用接口,將提交的信息與相關(guān)法律法規(guī)以及申報(bào)材料的上下文內(nèi)容進(jìn)行智能判斷和比對(duì)。

 

其次,為保證數(shù)據(jù)的處理效率和安全對(duì)接,本項(xiàng)目設(shè)計(jì)了一個(gè)數(shù)據(jù)適配層,其主要功能是將藥品注冊(cè)管理系統(tǒng)中的數(shù)據(jù)格式轉(zhuǎn)換為適合大語(yǔ)言模型處理的形式,同時(shí)確保數(shù)據(jù)在傳輸和處理過(guò)程中的安全性與隱私保護(hù)。具體而言,所有從藥品注冊(cè)管理系統(tǒng)通過(guò)數(shù)據(jù)適配層傳輸至大語(yǔ)言模型的數(shù)據(jù)均經(jīng)過(guò)脫敏處理,從而有效防止敏感信息在傳輸過(guò)程中被截取所造成的隱私泄露。

 

最后,為了提升用戶體驗(yàn),在系統(tǒng)集成階段應(yīng)特別關(guān)注界面的設(shè)計(jì)和交互流程。審查人員在使用系統(tǒng)時(shí),可以直觀地看到大語(yǔ)言模型給出的建議和結(jié)果,同時(shí)可以根據(jù)實(shí)際情況對(duì)這些結(jié)果進(jìn)行調(diào)整或確認(rèn)。這樣不僅能提高工作效率,還能增強(qiáng)審查決策的透明度和可信度。

 

3.2.4 測(cè)試

 

為了驗(yàn)證模型的實(shí)際表現(xiàn)和適用性,確保其能夠在真實(shí)業(yè)務(wù)環(huán)境中穩(wěn)定運(yùn)行并滿足實(shí)際需求,本項(xiàng)目針對(duì)基于大語(yǔ)言模型進(jìn)行智能化改造的藥品注冊(cè)管理系統(tǒng)進(jìn)行了測(cè)試。

 

為了確保測(cè)試結(jié)果的全面性和可靠性,本項(xiàng)目采用分層抽樣與邊界值分析法相結(jié)合的策略,構(gòu)建了多樣化的測(cè)試數(shù)據(jù)集,包括:符合藥品注冊(cè)形式審查標(biāo)準(zhǔn)的典型申報(bào)材料作為常規(guī)案例,用于驗(yàn)證模型在正常情況下的判斷準(zhǔn)確性和效率;不符合要求的申報(bào)材料作為異常案例,例如,材料缺失、格式錯(cuò)誤或違反特定法規(guī)的情況,用于測(cè)試模型識(shí)別問(wèn)題的能力;涉及新的法規(guī)條款或特殊審批流程的復(fù)雜申報(bào)材料作為邊緣案例,用于評(píng)估模型在處理少見(jiàn)或復(fù)雜場(chǎng)景時(shí)的表現(xiàn);收集與歷史人工審查記錄進(jìn)行對(duì)比分析的數(shù)據(jù),驗(yàn)證模型是否能夠達(dá)到人工審查的標(biāo)準(zhǔn)。

 

在測(cè)試過(guò)程中,采用多維度的評(píng)價(jià)指標(biāo)來(lái)全面衡量大語(yǔ)言模型的表現(xiàn),包括正確率、安全性、處理速度和可解釋性等[23]。正確率用于衡量模型正確判斷申報(bào)材料合規(guī)性的比例,這是測(cè)試的核心指標(biāo)之一;安全性評(píng)估用于確保模型在處理敏感數(shù)據(jù)時(shí)能夠遵循相關(guān)法律法規(guī),保護(hù)數(shù)據(jù)隱私并防止?jié)撛诘陌踩L(fēng)險(xiǎn);處理速度是指測(cè)試模型在不同規(guī)模數(shù)據(jù)集上的響應(yīng)時(shí)間,確保其能夠滿足實(shí)際業(yè)務(wù)中的效率要求;可解釋性用于衡量模型輸出結(jié)果的透明度,確保其生成的建議和結(jié)論能夠被審查人員理解和接受。

 

測(cè)試完成后對(duì)所有測(cè)試結(jié)果進(jìn)行詳細(xì)分析,并將其作為后續(xù)優(yōu)化的重要依據(jù)。對(duì)于模型表現(xiàn)優(yōu)異的部分,將相關(guān)策略固化到系統(tǒng)中,確保其在實(shí)際應(yīng)用中的穩(wěn)定性;針對(duì)模型表現(xiàn)欠佳的場(chǎng)景,進(jìn)一步調(diào)整訓(xùn)練數(shù)據(jù)或優(yōu)化算法,提升其處理特定任務(wù)的能力。

 

3.3 下一步計(jì)劃

 

藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)框架具備高度的靈活性和可擴(kuò)展性。在現(xiàn)有藥品注冊(cè)形式審查模型的基礎(chǔ)上,后續(xù)可以通過(guò)簡(jiǎn)單切換和升級(jí),將其轉(zhuǎn)化為適用于省級(jí)藥品監(jiān)管部門的子領(lǐng)域模型。通過(guò)這種方式,各地可以共享統(tǒng)一的技術(shù)底座,同時(shí)滿足個(gè)性化需求,避免重復(fù)開(kāi)發(fā),大幅降低資源投入和時(shí)間成本。

 

藥品監(jiān)管大語(yǔ)言模型在藥品注冊(cè)形式審查場(chǎng)景中的應(yīng)用,為后續(xù)將其應(yīng)用范圍擴(kuò)展至藥品全生命周期管理的其他關(guān)鍵環(huán)節(jié)積累了寶貴的技術(shù)經(jīng)驗(yàn)。通過(guò)對(duì)臨床試驗(yàn)審評(píng)審批、生產(chǎn)過(guò)程檢查和不良反應(yīng)監(jiān)測(cè)等環(huán)節(jié)應(yīng)用場(chǎng)景的探索與實(shí)踐,藥品監(jiān)管大語(yǔ)言模型將進(jìn)一步推動(dòng)藥品監(jiān)管工作的智能化升級(jí),實(shí)現(xiàn)從單一環(huán)節(jié)到全流程的智慧化管理,從而全面提升藥品監(jiān)管效能。

 

4. 藥品監(jiān)管大語(yǔ)言模型未來(lái)展望

 

智能化水平持續(xù)提升。隨著算法優(yōu)化、算力增強(qiáng)以及高質(zhì)量數(shù)據(jù)的積累,基于一體化建設(shè)框架的藥品監(jiān)管大語(yǔ)言模型將迎來(lái)智能化水平的進(jìn)一步提升,其生成內(nèi)容的可解釋性將持續(xù)增強(qiáng),在自然語(yǔ)言處理、數(shù)據(jù)分析預(yù)測(cè)及自動(dòng)化決策等方面的能力也將得到大幅提升。這將為藥品全生命周期管理提供更加精準(zhǔn)、高效的解決方案。

 

大語(yǔ)言模型應(yīng)用更加安全。隨著大語(yǔ)言模型技術(shù)的發(fā)展與高質(zhì)量數(shù)據(jù)集的建設(shè),模型推理的透明度和可解釋性將持續(xù)提升,不斷克服“幻覺(jué)”與算法偏見(jiàn)問(wèn)題,確保所生成結(jié)果的準(zhǔn)確性和可靠性。同時(shí),隨著藥品監(jiān)管領(lǐng)域安全制度的逐步完善,安全防護(hù)技術(shù)的深化應(yīng)用,以及從業(yè)人員安全培訓(xùn)體系的建立健全,藥品監(jiān)管大語(yǔ)言模型在實(shí)際應(yīng)用中的風(fēng)險(xiǎn)將進(jìn)一步降低,未來(lái)將能夠更廣泛、更安全地應(yīng)用于藥品監(jiān)管的各類業(yè)務(wù)中。

 

合作平臺(tái)發(fā)展壯大。未來(lái)協(xié)同創(chuàng)新平臺(tái)將發(fā)展成一個(gè)更加開(kāi)放、包容且充滿活力的技術(shù)生態(tài)系統(tǒng),吸引更多的合作伙伴積極參與其中。通過(guò)持續(xù)的技術(shù)創(chuàng)新和業(yè)務(wù)優(yōu)化,基于一體化建設(shè)框架的藥品監(jiān)管大語(yǔ)言模型將不斷提升其性能與適用性,從而全方位、深層次地推動(dòng)藥品監(jiān)管工作的智能化水平整體躍升。

 

個(gè)性化服務(wù)開(kāi)發(fā)更加高效。基于基礎(chǔ)模型、主領(lǐng)域模型和核心子領(lǐng)域模型,通過(guò)結(jié)合具體的個(gè)性化業(yè)務(wù)需求進(jìn)行知識(shí)蒸餾,可快速生成適用于特定場(chǎng)景的輕量化模型。隨著藥品監(jiān)管大語(yǔ)言模型一體化建設(shè)的完善,各級(jí)藥品監(jiān)管部門在開(kāi)發(fā)個(gè)性化服務(wù)時(shí)將更加高效,大大節(jié)約模型訓(xùn)練、部署的時(shí)間,降低所需算力資源。

 

引用本文

 

陳鋒,吳欣然.大語(yǔ)言模型在藥品監(jiān)管中的應(yīng)用實(shí)踐與思考[J].中國(guó)食品藥品監(jiān)管.2025.3(254):4-13.

 
 
分享到:

來(lái)源:中國(guó)食品藥品監(jiān)管雜志

相關(guān)新聞: