您當(dāng)前的位置:檢測(cè)資訊 > 科研開(kāi)發(fā)
嘉峪檢測(cè)網(wǎng) 2021-07-17 22:48
盡管人工智能(Artificial intelligence, AI)對(duì)圖像識(shí)別等領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響,但在藥物發(fā)現(xiàn)方面仍處于起步階段,目前主要集中在給定化合物的類(lèi)似物識(shí)別,構(gòu)效關(guān)系(Structure-Activity Relationship, SAR)分析,部分物理化學(xué)性質(zhì)的預(yù)測(cè)上等。
然而,在面對(duì)傳統(tǒng)技術(shù)難以突破的難靶先導(dǎo)化合物發(fā)現(xiàn)及多維的成藥性決策上仍突破很少,尤其是在First-in-class功能化合物發(fā)現(xiàn)和體內(nèi)功效方面,尚未能完全發(fā)揮AI在藥物研發(fā)中的潛力。因此,選擇藥物研發(fā)中什么樣的科學(xué)問(wèn)題以及要對(duì)哪些成藥指標(biāo)進(jìn)行建模將是在藥物研發(fā)中發(fā)揮AI突破的關(guān)鍵。
20世紀(jì)80年代以來(lái),來(lái)源于化學(xué)計(jì)量學(xué)和計(jì)算機(jī)科學(xué)的算法逐步應(yīng)用并擴(kuò)展到藥物的合成與分析,如基于結(jié)構(gòu)的藥物設(shè)計(jì)(Computer-Aided Drug Design, CADD),常用于解釋藥物化學(xué)結(jié)構(gòu)變化與活性的關(guān)系的構(gòu)效關(guān)系;定性/定量機(jī)器學(xué)習(xí)方法(Machine Learning, ML),對(duì)水溶性、代謝性、毒性等進(jìn)行預(yù)測(cè)。
隨著生物信息學(xué)的不斷發(fā)展,其技術(shù)也在不斷與藥物研發(fā)中用到的算法相比較并互相融入。藥學(xué)是一個(gè)融合化學(xué)和生物學(xué)的學(xué)科,在數(shù)據(jù)層面,我們首先看一下來(lái)自化學(xué)和生物領(lǐng)域數(shù)據(jù)的差異:

如上所示,當(dāng)前化學(xué)信息顯然比生物學(xué)信息可適合進(jìn)行人工智能計(jì)算處理。物理化學(xué)中熱力學(xué)基本原則可以在一定程度上明確配體對(duì)受體的親和力。
與之相比,在生物學(xué)中受體蛋白的構(gòu)象變化,平衡和偏置信號(hào)就難以定量;當(dāng)研究涉及到基因表達(dá)量或蛋白質(zhì)修飾的變化時(shí),會(huì)變得更加困難,因?yàn)榻I婕傲藢?duì)空間變化和時(shí)間變化進(jìn)行模擬。
當(dāng)前一些藥物發(fā)現(xiàn)的輔助細(xì)分領(lǐng)域中,我們能夠很好地描述化學(xué)數(shù)據(jù),并且有大量可用于模型建立的測(cè)定數(shù)據(jù)(如小分子的各種體外物理化學(xué)性質(zhì)和晶型),這些也是當(dāng)前AI可以發(fā)揮作用的地方。
但是在真實(shí)藥物的核心研發(fā)步驟中,對(duì)于小分子藥物在生物系統(tǒng)中的作用很難用一組有限的參數(shù)來(lái)定義,使得人工智能在藥物發(fā)現(xiàn)和藥效評(píng)估上面臨著更大的不確定性。
簡(jiǎn)而言之,藥物研發(fā)中開(kāi)展AI需要可以定量的變量和有意義的標(biāo)記。但是在特定的生物靶標(biāo)體系中,我們常常無(wú)法確定哪些是重要的變量,難以通過(guò)實(shí)驗(yàn)對(duì)其進(jìn)行定義并獲得數(shù)據(jù),也無(wú)法在與AI兼容的水平上構(gòu)建體現(xiàn)生物學(xué)功能的參數(shù)。在此,我們對(duì)當(dāng)前藥物研發(fā)中數(shù)據(jù)的AI利用進(jìn)行一些回顧和反思。
藥物發(fā)現(xiàn)中,質(zhì)量決策比速度和成本更重要

考慮到一個(gè)專(zhuān)利壽命為20年,假設(shè)在臨床一期開(kāi)始時(shí)提交專(zhuān)利申請(qǐng),為了項(xiàng)目平均能夠覆蓋成本,我們比較了提高化合物的發(fā)現(xiàn)速度(每一階段花費(fèi)時(shí)間減少20%)、提高化合物的成藥質(zhì)量(每一階段故障率減少20%)和降低化合物成本(減少20%)對(duì)藥物發(fā)現(xiàn)項(xiàng)目?jī)衾麧?rùn)的影響(如上圖)。
可以看出,化合物質(zhì)量對(duì)項(xiàng)目的成功有更深遠(yuǎn)的影響,遠(yuǎn)遠(yuǎn)超出了提高各自階段的提高速度和降低成本。降低由于化合物質(zhì)量帶來(lái)的損失對(duì)項(xiàng)目?jī)r(jià)值的總體影響最大,遠(yuǎn)比提高化合物發(fā)現(xiàn)及推進(jìn)速度重要。換句話(huà)說(shuō),提高化合物的藥物成功率可減少將藥物推向市場(chǎng)所需的試驗(yàn)次數(shù),而失敗次數(shù)的減少比更快或較少花費(fèi)的失敗更為重要。
這一分析結(jié)果對(duì)于AI在藥物發(fā)現(xiàn)中的應(yīng)用有著重要意義。原則上,AI可以實(shí)現(xiàn)以上所有目標(biāo):可以更快地做出決策(預(yù)測(cè)要比實(shí)驗(yàn)快)并且可以更便宜地進(jìn)行決策(預(yù)測(cè)的成本要低于實(shí)驗(yàn)),并可以做出更好的決策(在合適的數(shù)據(jù)或模擬允許的情況下,以及如果有事實(shí)支持,決策會(huì)更好)。
然而,目前人工智能在藥物發(fā)現(xiàn)中的主要重點(diǎn)似乎是加快速度和節(jié)省成本,而不是決策化合物的質(zhì)量或是對(duì)藥效成功的影響。那么在AI藥物研發(fā)中,應(yīng)該如何定義化合物質(zhì)量的成功?為了使AI在藥物發(fā)現(xiàn)項(xiàng)目中顯示其價(jià)值,這一關(guān)注點(diǎn)可能需要進(jìn)一步明確,模型構(gòu)建不應(yīng)局限于加快每一階段的速度和節(jié)省成本。
當(dāng)前處于各自孤立機(jī)制和靶標(biāo)中使用的AI發(fā)展困境

如上圖所示,化合物可以通過(guò)調(diào)節(jié)蛋白質(zhì)活性來(lái)實(shí)現(xiàn)它們的效果,但這一過(guò)程會(huì)受到藥物代謝、藥物活性以及非靶點(diǎn)效應(yīng)等多重因素影響。
在目前AI方法面向的藥物發(fā)現(xiàn)中,其主要關(guān)注點(diǎn)是化合物對(duì)蛋白質(zhì)的活性,而化合物在體內(nèi)的其他特性(包括其前體化合物,代謝產(chǎn)物,濃度依賴(lài)性效應(yīng)等)則在模型中被降級(jí)為次要的或可忽略部分。
由于AI模型從一開(kāi)始就很少考慮生物學(xué)的復(fù)雜性,使得這種模型方案在實(shí)際應(yīng)用存在多個(gè)問(wèn)題而降低成功率:
? 僅在單因果疾病的情況下才是合理的,如在病毒感染的情況下,某種蛋白酶是復(fù)制或者受體進(jìn)入細(xì)胞所必要的?;谶@類(lèi)單一靶點(diǎn)確實(shí)有效并且已經(jīng)產(chǎn)生了大量的批準(zhǔn)藥物。但是,更多較復(fù)雜的疾病難以靠單一靶點(diǎn)調(diào)控進(jìn)行有效修復(fù),導(dǎo)致了許多基于單一靶點(diǎn)藥物在臨床實(shí)驗(yàn)中失敗。
? 在AI系統(tǒng)中往往會(huì)簡(jiǎn)化模型而忽視其他問(wèn)題,如化合物是否到達(dá)其預(yù)期的靶點(diǎn),是否能夠治療患病的表型,以及它的副作用是否在可以接受的范圍。
? AI系統(tǒng)要取得成功,需要建立明確的“化合物-靶點(diǎn)-表型”聯(lián)系,這是在當(dāng)前生物醫(yī)學(xué)知識(shí)下非常困難的。
藥物發(fā)現(xiàn)中相關(guān)的化學(xué)和生物數(shù)據(jù)特征及其未來(lái)可擴(kuò)展空間

如上表所示,當(dāng)前藥物發(fā)現(xiàn)項(xiàng)目中使用的代表性指標(biāo)。大部分并不能很好地表征人體體內(nèi)的實(shí)際情況。
近年來(lái),出現(xiàn)了一些來(lái)源于臨床相關(guān)模型的高通量數(shù)據(jù),例如用于高通量測(cè)試的異質(zhì)細(xì)胞系統(tǒng)及其參數(shù)(3D中的細(xì)胞間相互作用和滲透性)和患者衍生的測(cè)試系統(tǒng)(癌癥中患者衍生PDX模型)。
這些系統(tǒng)產(chǎn)生的數(shù)據(jù)將來(lái)可能會(huì)對(duì)藥物發(fā)現(xiàn)產(chǎn)生重大影響;但當(dāng)前階段,可用于AI挖掘的數(shù)據(jù)仍相對(duì)較少,需要生成足夠大量的數(shù)據(jù)才能真正實(shí)用。
人工智能在藥物發(fā)現(xiàn)中的未來(lái)展望
為了充分發(fā)揮人工智能在藥物發(fā)現(xiàn)中的作用,我們需要提高針對(duì)靶點(diǎn)發(fā)現(xiàn)的化合物質(zhì)量。但在多數(shù)情況下,可用于做出這些決定的數(shù)據(jù)并不完全適合這一目的。
因此,我們未來(lái)需要更多的高質(zhì)量化合物數(shù)據(jù)進(jìn)行AI研究,包括這些化合物的體外活性/毒性指數(shù),正確劑量/藥代動(dòng)力學(xué)數(shù)據(jù)等。
在后期階段,還需要這些化合物的動(dòng)物模型藥效和毒性數(shù)據(jù)。此外,我們還需要更有效地進(jìn)行臨床試驗(yàn),以獲得高質(zhì)量化合物臨床數(shù)據(jù)。
盡管藥物發(fā)現(xiàn)中的AI領(lǐng)域最近受到了廣泛關(guān)注,但是利用我們當(dāng)前的數(shù)據(jù)生成和利用方式,我們不太可能實(shí)現(xiàn)使高質(zhì)量的藥物發(fā)現(xiàn)決策。
雖然化學(xué)數(shù)據(jù)可大規(guī)模獲得,并已成功用于配體設(shè)計(jì)和合成,但是這些數(shù)據(jù)并不能滿(mǎn)足AI藥物發(fā)現(xiàn)的需求。為了真正推動(dòng)該領(lǐng)域的發(fā)展,我們需要更好地了解生物學(xué),并以假設(shè)驅(qū)動(dòng)的方式生成包含感興趣信號(hào)的數(shù)據(jù),這些信號(hào)與療效和毒性均相關(guān)。
換句話(huà)說(shuō),我們需要讓更多高質(zhì)量候選化合物進(jìn)入臨床,更好地驗(yàn)證靶點(diǎn),改善患者招募并更好地推進(jìn)臨床試驗(yàn)的進(jìn)行,所有這些方面都是為了生成更恰當(dāng)?shù)胤从乘幬锇l(fā)現(xiàn)生物學(xué)方面的數(shù)據(jù)。只有當(dāng)這些數(shù)據(jù)可用于AI方法,才能期望該領(lǐng)域取得真正的進(jìn)展。
參考文獻(xiàn)
1. LeCun, Y. et al. (2015) Deep learning. Nature 521, 436–444
2. Griffen, E.J. et al. (2020) Chemists: AI is here, unite to get the benefits. J. Med. Chem. 63, 8695–8704
3. Bender A. et al. (2020) Artificial intelligence in drug discovery: what is realistic, what are illusions? Part 1: Ways to make an impact, and why we are not there yet. Drug Discov Today. doi: 10.1016/j.drudis.2020.12.009.

來(lái)源:分子設(shè)計(jì)