2024年2月14日,Biorelate首席執(zhí)行官Daniel Jamieson在Drug Discov Today發(fā)表文章Gen AI's real opportunity in drug development? As a smart, strategic decision aid,探討了生成式人工智能在藥物研發(fā)中的真正機(jī)遇。
Biorelate搭建了Galactic AI™平臺(tái),利用人工智能技術(shù),為科學(xué)家和開(kāi)發(fā)未來(lái)創(chuàng)新產(chǎn)品的機(jī)構(gòu)提供和實(shí)現(xiàn)重要的洞察力。
生成式人工智能(GenAI)目前在生命科學(xué)領(lǐng)域備受關(guān)注,它包括深度學(xué)習(xí)算法,可以將復(fù)雜的知識(shí)提煉成易于了解的摘要,可以將公司的整個(gè)研發(fā)戰(zhàn)略匯集到一個(gè)超級(jí)決策智能工具中,從而幫助完善藥物研發(fā)及其成果。
將一種新藥推向市場(chǎng)需要花費(fèi)數(shù)十億美元(見(jiàn)《制藥研發(fā)生產(chǎn)力分析--需要新視角》,美國(guó)國(guó)立衛(wèi)生研究院,2023年7月,參考資料1)。隨著生物制藥公司對(duì)產(chǎn)品和療法創(chuàng)新方面的追求越來(lái)越高,失敗率也隨之上升。選擇最適合商業(yè)化的候選藥物仍然是一項(xiàng)痛苦且成本高昂的挑戰(zhàn),而GenAI可以幫助改變這一局面。這就需要藥物開(kāi)發(fā)商戰(zhàn)略性地應(yīng)用該技術(shù),而不是在單一部門(mén)或某一案例中戰(zhàn)術(shù)性地應(yīng)用該技術(shù)。
識(shí)別微妙的新關(guān)聯(lián)
GenAI的更大機(jī)遇在于,根據(jù)該領(lǐng)域已知的一切重要信息,以及結(jié)合和交叉參考一系列表面上看似毫不相干的不同見(jiàn)解的能力,推斷出哪些新藥值得開(kāi)發(fā)。這種新的、全面的清晰度可以在更廣泛的藥物開(kāi)發(fā)過(guò)程中大大節(jié)約成本,更重要的是,可以加快向最需要的患者提供更多藥物。
GenAI是人工智能的一個(gè)子集,通過(guò)機(jī)器學(xué)習(xí),它可以從龐大的知識(shí)庫(kù)中快速提煉出關(guān)鍵信息和見(jiàn)解,并從中創(chuàng)造出直觀、易于消化的新產(chǎn)出。作為藥物研發(fā)的戰(zhàn)略組成部分,該技術(shù)能以可靠、便捷的方式利用智能、大規(guī)模數(shù)據(jù)分析。
任何藥物開(kāi)發(fā)商都不能浪費(fèi)時(shí)間和資源去重復(fù)已經(jīng)進(jìn)行過(guò)的研究,或追求有問(wèn)題的下一代藥物--除非他們能準(zhǔn)確找到對(duì)成功起關(guān)鍵作用的見(jiàn)解。已發(fā)表的研究成果和其他文本可能包含豐富的知識(shí),但在大多數(shù)情況下,這些知識(shí)仍未經(jīng)整理,規(guī)模也難以捉摸。例如,盡管在現(xiàn)有文本中可能存在大量因果關(guān)系,但這些關(guān)系仍然難以定位、連接和分析。
在一項(xiàng)科學(xué)研究中,研究人員可能研究了特定藥物如何觸發(fā)特定蛋白質(zhì)的反應(yīng)。與此同時(shí),另一項(xiàng)研究可能會(huì)強(qiáng)調(diào),這種被激活的蛋白質(zhì)與高血壓的發(fā)病有關(guān)。雖然這些研究結(jié)果各自提供了有價(jià)值的見(jiàn)解,但只有將它們聯(lián)系起來(lái),才會(huì)產(chǎn)生潛在的假設(shè):在這種情況下,有關(guān)藥物可能會(huì)帶來(lái)誘發(fā)高血壓的風(fēng)險(xiǎn)。
試想一下,如果能將迄今為止一直以文本形式保存在內(nèi)部檔案和/或數(shù)百萬(wàn)篇科研文章中的寶貴數(shù)據(jù)與所有其他結(jié)構(gòu)化數(shù)據(jù)源(如轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué))結(jié)合起來(lái),就能對(duì)其進(jìn)行結(jié)構(gòu)化處理和分析。這就是GenAI的優(yōu)勢(shì)所在。
可實(shí)現(xiàn)的投資回報(bào)率:了解資源的重點(diǎn)所在
任何能夠幫助藥物開(kāi)發(fā)公司更快,并通過(guò)減少額外試驗(yàn)的需要來(lái)提高批準(zhǔn)和市場(chǎng)準(zhǔn)入速度的方法,都有助于實(shí)現(xiàn)其在開(kāi)發(fā)周期中優(yōu)化支出和控制成本的目標(biāo),并使關(guān)鍵藥物更快地進(jìn)入市場(chǎng)。
在可能涉及數(shù)百個(gè)藥物項(xiàng)目的宏觀層面上,哪怕只是將藥物的成功幾率提高1-2%、加快上市速度或抓住更多機(jī)會(huì),都會(huì)對(duì)整個(gè)藥物研發(fā)管線產(chǎn)生巨大影響。有針對(duì)性地適當(dāng)應(yīng)用人工智能,從龐大的研究檔案中獲取有價(jià)值的見(jiàn)解,可使臨床試驗(yàn)過(guò)程的某些環(huán)節(jié)提高10到100倍。將早期目標(biāo)選擇到I期臨床試驗(yàn)的時(shí)間從原來(lái)的四年半縮短到一年,這意味著速度的顯著提高。
制定人工智能戰(zhàn)略
迄今為止,很少能看到一個(gè)超越研發(fā)并延伸至商業(yè)規(guī)劃的單一業(yè)務(wù)層面目標(biāo),能夠以一種綜合的方式影響一切。但隨著企業(yè)逐漸認(rèn)識(shí)到GenAI的更大潛力,這種情況很可能會(huì)發(fā)生改變--GenAI將成為整個(gè)組織的"聊天機(jī)器人"或知識(shí)助手,提供明智的指導(dǎo)。
葛蘭素史克在這方面取得了良好的進(jìn)展,它通過(guò)自己的GenAI大型語(yǔ)言模型(LLM)來(lái)完成專業(yè)任務(wù),并通過(guò)對(duì)話界面讓用戶無(wú)需了解公司的數(shù)據(jù)生態(tài)系統(tǒng)就能探索復(fù)雜的研究問(wèn)題。
擴(kuò)大Gen AI的覆蓋范圍:現(xiàn)實(shí)檢查
生成式人工智能提供了一種與數(shù)據(jù)和其他人工智能模型對(duì)接的新方法,讓用戶不僅可以詢問(wèn)生物制藥公司及其藥物的財(cái)務(wù)業(yè)績(jī)等問(wèn)題,還可以更深入地詢問(wèn):"市場(chǎng)上表現(xiàn)最好的藥物有哪些,它們的共同作用機(jī)制是什么?"
當(dāng)然,人工智能也在不斷發(fā)展,增加了更多的可能性。2024年,多模態(tài)算法(MLM)將成為一個(gè)巨大的、不斷增長(zhǎng)的趨勢(shì),為團(tuán)隊(duì)提供了不僅審閱文本,而且審閱圖像、聲音和視頻的機(jī)會(huì)。
然而,比潛在應(yīng)用更重要的是人工智能能力的穩(wěn)健性和可靠性。除非團(tuán)隊(duì)能夠絕對(duì)信任所返回結(jié)果的有效性,并將其追溯到源頭,否則始終需要進(jìn)行進(jìn)一步的艱苦評(píng)估和分析。
要想讓生成式人工智能作為藥物發(fā)現(xiàn)領(lǐng)域可靠的"真理之源"而受到信任,知識(shí)來(lái)源必須透明且經(jīng)過(guò)驗(yàn)證,同時(shí)還要說(shuō)明是如何建立聯(lián)系的(見(jiàn)box)。
重要的是,既要立足于細(xì)節(jié),又要有超越單一GenAI用例的愿景。
生命科學(xué)是否可以信賴生成式人工智能?
生成式人工智能的潛在價(jià)值直接取決于它所利用和訓(xùn)練的數(shù)據(jù)源的質(zhì)量和可信度。要使這項(xiàng)技術(shù)成為可靠的"真理之源",尤其是在關(guān)鍵的生命科學(xué)應(yīng)用中,知識(shí)來(lái)源必須經(jīng)過(guò)驗(yàn)證。此外,利用的資源以及如何建立聯(lián)系和獲得新的見(jiàn)解也必須完全透明。
檢索-增強(qiáng)生成(RAG)是一種公認(rèn)的數(shù)據(jù)整理和質(zhì)量控制方法。這是一種從外部知識(shí)庫(kù)中檢索事實(shí)的人工智能框架。它可以確保生成式人工智能系統(tǒng)利用最準(zhǔn)確和最新的信息,同時(shí)為用戶(以及必要時(shí)的監(jiān)管機(jī)構(gòu))提供發(fā)現(xiàn)過(guò)程和知識(shí)關(guān)聯(lián)的透明度。
這種透明度不僅能確保系統(tǒng)參考了現(xiàn)有資料來(lái)源,還意味著用戶可以找到原始資料并進(jìn)行更詳細(xì)的閱讀。
生成式人工智能的孤立應(yīng)用可能會(huì)限制生命科學(xué)的轉(zhuǎn)型潛力
如果藥物發(fā)現(xiàn)、開(kāi)發(fā)和商業(yè)化活動(dòng)及預(yù)算繼續(xù)孤立管理,生成式人工智能項(xiàng)目繼續(xù)以零敲碎打的方式應(yīng)用于個(gè)別應(yīng)用,那么該技術(shù)更廣泛的潛力就可能受到抑制。
使用生成式人工智能有兩種主要策略。在單個(gè)部門(mén)/孤立的應(yīng)用中部署該技術(shù)對(duì)許多用例來(lái)說(shuō)都是合理的:這是每個(gè)人現(xiàn)在都在做的事情,而且行之有效。但還有一個(gè)更大的機(jī)會(huì),迄今為止,這個(gè)機(jī)會(huì)在很大程度上尚未被利用。那就是在所有部門(mén)使用GenAI,將整個(gè)公司的戰(zhàn)略整合到一個(gè)超級(jí)決策智能工具中。雖然這在今天可能還不能百分之百實(shí)現(xiàn),但公司可以采取一些措施來(lái)為自己定位,以迎接這個(gè)更廣闊的機(jī)遇,因?yàn)檫@些能力肯定會(huì)到來(lái)。
參考資料:
【1】https://pubmed.ncbi.nlm.nih.gov/37506762/
【2】https://uamsd.66557.net/science/article/pii/S135964462400028X