中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

您當(dāng)前的位置:檢測(cè)資訊 > 科研開發(fā)

人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

嘉峪檢測(cè)網(wǎng)        2021-08-19 12:35

藥物發(fā)現(xiàn)和研發(fā)是制藥企業(yè)和化學(xué)科學(xué)家的重要研究領(lǐng)域。然而,低效率和高成本給該領(lǐng)域帶來了障礙。此外,處理來自基因組學(xué)、蛋白質(zhì)組學(xué)、微陣列和臨床試驗(yàn)的大量復(fù)雜數(shù)據(jù)也存在挑戰(zhàn)。

 

人工智能和機(jī)器學(xué)習(xí)技術(shù)使制藥領(lǐng)域?qū)崿F(xiàn)了現(xiàn)代化。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法已被應(yīng)用于多肽合成、虛擬篩選、毒性預(yù)測(cè)、藥物監(jiān)測(cè)和釋放、藥效團(tuán)建模、定量構(gòu)效關(guān)系、藥物重定位、多藥理和生理活性等藥物發(fā)現(xiàn)過程。此外,新的數(shù)據(jù)挖掘和管理技術(shù)為最近開發(fā)的建模算法提供了支持。

 

今天為大家解讀的文獻(xiàn)是Molecular Diversity雜志于今年4月發(fā)表的《Artificial intelligence to deep learning: machine intelligence approach for drug discovery》[1],第一作者為印度DTU的Rohan Gupta教授。由于閱讀后對(duì)編者啟發(fā)很大,所以整理后分享出來,如有理解不當(dāng)之處,懇請(qǐng)大家批評(píng)指正。

 

人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

 

圖1 人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

 

人工智能的演進(jìn):從機(jī)器學(xué)習(xí)到深度學(xué)習(xí)

 

人工智能(AI),也被稱為機(jī)器智能,指的是計(jì)算機(jī)系統(tǒng)從輸入或過去的數(shù)據(jù)中學(xué)習(xí)的能力,術(shù)語“人工智能”通常用于機(jī)器在學(xué)習(xí)和解決問題過程中模仿與人腦相關(guān)的認(rèn)知行為。2015年9月,谷歌顯示AI已成為搜索量最大的詞匯。

一些人將機(jī)器學(xué)習(xí)(ML)描述為“AI的應(yīng)用”,而另一些人則將其描述為“AI的子集”。ML將數(shù)據(jù)與樸素貝葉斯、決策樹(DT)、隱馬爾可夫模型(HMM)等算法一起輸入機(jī)器,使其在不顯式編程的情況下進(jìn)行學(xué)習(xí)。大約在20世紀(jì)中旬,Igor Aizenberg和他的同事們?cè)谡務(wù)撊斯ど窠?jīng)網(wǎng)絡(luò)(ANN)時(shí),首次提出了“深度學(xué)習(xí)(DL)”這一術(shù)語。

 

根據(jù)《人工智能:現(xiàn)代方法》中的討論,人工智能有七種分類(圖2),分別是推理和問題解決、知識(shí)表示、規(guī)劃和社會(huì)智能、感知、機(jī)器學(xué)習(xí)、機(jī)器人:運(yùn)動(dòng)和操縱,以及自然語言處理。機(jī)器學(xué)習(xí)進(jìn)一步分為三個(gè)重要子集:監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和深度學(xué)習(xí);而自然語言處理被分為五個(gè)主要子集,包括分類、機(jī)器翻譯、問答、文本生成和內(nèi)容提取??梢哉f,DL是ML的子集,ML是AI的子集,進(jìn)化的順序是AI>ML>DL。

 

人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

 

圖2 人工智能的分類

 

藥物發(fā)現(xiàn)的革命性過程:大數(shù)據(jù)和人工智能的作用

 

大數(shù)據(jù)可以定義為過于龐大和錯(cuò)綜復(fù)雜的數(shù)據(jù)集,無法使用傳統(tǒng)的數(shù)據(jù)分析軟件、工具和技術(shù)進(jìn)行分析。大數(shù)據(jù)的三個(gè)主要特征是體積、速度和多樣性,其中體積代表產(chǎn)生的大量數(shù)據(jù),速度代表這些數(shù)據(jù)被再現(xiàn)的速率,多樣性代表數(shù)據(jù)集中存在的異質(zhì)性。隨著微陣列、RNA-seq和高通量測(cè)序(HTS)技術(shù)的出現(xiàn),每天都會(huì)產(chǎn)生過多的生物醫(yī)學(xué)數(shù)據(jù),當(dāng)代藥物發(fā)現(xiàn)也因此進(jìn)入了大數(shù)據(jù)時(shí)代。

在藥物發(fā)現(xiàn)中,第一步也是最重要的一步是確定與疾病病理生理學(xué)有關(guān)的適當(dāng)靶點(diǎn)(如基因、蛋白質(zhì)),然后找到可以干擾這些靶點(diǎn)的藥物或類藥物分子。如今我們可以搜索一系列生物醫(yī)學(xué)數(shù)據(jù)庫來實(shí)現(xiàn),如NCBI GEO、癌癥基因組圖譜(TCGA)和Arrayexpress等等。有時(shí)甚至出版的文獻(xiàn)也可以用于識(shí)別靶點(diǎn),如PubMed是各種已出版生物醫(yī)學(xué)文獻(xiàn)的數(shù)據(jù)庫,對(duì)其進(jìn)行數(shù)據(jù)挖掘可以幫助識(shí)別不同疾病的靶點(diǎn)。此外,人工智能的發(fā)展使得大數(shù)據(jù)分析變得容易得多,因?yàn)楝F(xiàn)在有無數(shù)的ML技術(shù)可用,這些技術(shù)可以幫助提取這些大型生物醫(yī)學(xué)數(shù)據(jù)集中存在的有用特征、模式和結(jié)構(gòu)。如Han等人[2]利用大數(shù)據(jù)和人工智能在2019年開發(fā)了DriverML,這是一個(gè)基于ML監(jiān)督學(xué)習(xí)的工具,可以指出與癌癥相關(guān)的驅(qū)動(dòng)基因。

在確定和驗(yàn)證了合適的靶點(diǎn)之后,下一步是尋找合適的藥物或類藥物分子,這些分子可以與靶點(diǎn)相互作用并引起所需的反應(yīng)。在大數(shù)據(jù)時(shí)代,我們可以支配海量的大型化學(xué)數(shù)據(jù)庫,這些數(shù)據(jù)庫可以幫助我們找到針對(duì)特定靶點(diǎn)的完美藥物。比如PubChem是一個(gè)免費(fèi)的化學(xué)數(shù)據(jù)庫,其中包含各種化學(xué)結(jié)構(gòu)的數(shù)據(jù),包括它們的生物、物理、化學(xué)和毒性特性;ChEMBL包含許多具有類似藥物特性的生物活性化合物的數(shù)據(jù),還包含有關(guān)這些化合物的吸收、分布、新陳代謝和排泄(ADME)、毒性特性,甚至它們的靶相互作用的信息;其他的化學(xué)數(shù)據(jù)庫還包括DrugBank、LINCS L1000和PDB等。

 

人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

 

圖3 大數(shù)據(jù)在藥物設(shè)計(jì)和發(fā)現(xiàn)中的應(yīng)用

 

人工智能和傳統(tǒng)化學(xué)的結(jié)合:促進(jìn)藥物發(fā)現(xiàn)

 

隨著技術(shù)的進(jìn)步和高性能計(jì)算機(jī)的發(fā)展,在計(jì)算機(jī)輔助藥物設(shè)計(jì)(CADD)中補(bǔ)充了從ML到DL的一系列人工智能算法。在過去的二十年里,發(fā)展了許多用于計(jì)算藥物發(fā)現(xiàn)、定量結(jié)構(gòu)活性關(guān)系(QSAR)和自由能最小化技術(shù)的工具。例如,使用機(jī)器智能方法(如DT、隨機(jī)森林(RF)方法、CNN、SVM、LSTM網(wǎng)絡(luò)和梯度增強(qiáng)機(jī))區(qū)分復(fù)合細(xì)胞活性。類似地,使用QSAR方法預(yù)測(cè)PAMPA有效滲透率時(shí),結(jié)果表明相比于偏最小二乘(PLS)方案,使用分層支持向量機(jī)(HSVR)方案開發(fā)的基于ML的模型在訓(xùn)練集、測(cè)試集和統(tǒng)計(jì)分析方面執(zhí)行得更好。另外,對(duì)于新化合物的合成,化學(xué)科學(xué)家常常借助已發(fā)表的文獻(xiàn),而隨著涉及AI和ML的自動(dòng)藥物發(fā)現(xiàn)方法的進(jìn)步,區(qū)分現(xiàn)有藥物和新的化學(xué)結(jié)構(gòu)變得相對(duì)簡單。

 

傳統(tǒng)的面向化學(xué)的藥物發(fā)現(xiàn)與人工智能藥物設(shè)計(jì)相結(jié)合,提供了一個(gè)很好的研究平臺(tái)。此外,世界各地的系統(tǒng)生物學(xué)和化學(xué)科學(xué)家與計(jì)算科學(xué)家合作,開發(fā)現(xiàn)代ML算法和原理,可以促進(jìn)藥物的發(fā)現(xiàn)和開發(fā)。

 

人工智能在藥物發(fā)現(xiàn)與藥物研發(fā)中的應(yīng)用

 

在藥物發(fā)現(xiàn)和開發(fā)過程中,最艱巨和令人沮喪的一步是尋找存在于浩瀚化學(xué)空間中合適的、具有生物活性的藥物分子;而最令人氣憤的,是十分之九的藥物分子通常不能通過第二階段臨床試驗(yàn)和其他監(jiān)管批準(zhǔn)。上述事件可以通過實(shí)施基于人工智能的工具和技術(shù)來解決。人工智能可以參與藥物開發(fā)過程的每一個(gè)階段:

 

5.1 一次和二次藥物篩選

 

在藥物發(fā)現(xiàn)中,先導(dǎo)化合物的篩選是至關(guān)重要的,人工智能在識(shí)別新的和潛在的先導(dǎo)化合物方面發(fā)揮著巨大的作用。在化學(xué)空間中有大約1.06億個(gè)化學(xué)結(jié)構(gòu),他們來自不同的研究,如基因組研究、臨床和臨床前研究、體內(nèi)分析和微陣列分析。利用機(jī)器學(xué)習(xí)模型,如強(qiáng)化模型、Logistic模型、回歸模型和生成模型,根據(jù)活性位點(diǎn)、結(jié)構(gòu)和靶結(jié)合能力可以篩選出這些化學(xué)結(jié)構(gòu)。

 

人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

 

圖4 人工智能在一次和二次藥物篩選中的應(yīng)用

 

5.2 肽合成與小分子設(shè)計(jì)

 

多肽是一種由大約2-50個(gè)氨基酸組成的生物活性小鏈,由于它們具有跨越細(xì)胞屏障的能力并可以到達(dá)所需的靶點(diǎn),因此越來越多地被用于治療。近年來,研究人員利用人工智能的優(yōu)勢(shì)發(fā)現(xiàn)了新肽。例如,Yan[3]等人在2020開年發(fā)了基于DL的短抗菌肽(AMPs)鑒定平臺(tái)Deep-AmPEP30。AmPEP30是一種CNN驅(qū)動(dòng)的工具,可以根據(jù)DNA序列數(shù)據(jù)預(yù)測(cè)短AMP。使用該平臺(tái),研究人員從一種存在于胃腸道的真菌病原體——光滑梭菌的基因組序列中鑒定出新的AMPs。

 

小分子是分子量非常低的分子,就像肽一樣,利用人工智能也可以用來探索小分子的治療作用。例如,Zhavoronkov等人[4]設(shè)計(jì)了一種基于生成性強(qiáng)化學(xué)習(xí)的小分子從頭設(shè)計(jì)工具GENTRL,并利用它發(fā)現(xiàn)了一種新的酶抑制劑,DDR1激酶。

 

5.3 藥物劑量和給藥效果的識(shí)別

 

給病人任何不適當(dāng)劑量的藥物都可能導(dǎo)致不良和致命的副作用,多年來,確定能夠以最小毒副作用達(dá)到預(yù)期效果的藥物的最佳劑量一直是一個(gè)挑戰(zhàn)。隨著人工智能的出現(xiàn),許多研究人員正在借助ML和DL算法來確定合適的藥物劑量。

 

例如,Shen等人[5]開發(fā)了一個(gè)基于人工智能的平臺(tái),稱為AI-PRS,用于確定通過抗逆轉(zhuǎn)錄病毒療法治療艾滋病毒的最佳劑量和藥物組合。AI-PRS是一種神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的方法,它通過拋物線響應(yīng)曲線(PRS)將藥物組合和劑量與療效聯(lián)系起來。在他們的研究中,10名HIV患者聯(lián)合使用替諾福韋、法韋倫和拉米夫定,AI-PRS分析表明替諾福韋的劑量可以減少起始劑量的33%,而不會(huì)導(dǎo)致病毒復(fù)發(fā)。

 

5.4 生物活性物質(zhì)預(yù)測(cè)與藥物釋放監(jiān)測(cè)

 

最近已經(jīng)開發(fā)了多種在線工具來分析藥物釋放,以及選定的生物活性化合物作為載體的可行性。最常用的是基于化學(xué)特征的藥效團(tuán)評(píng)價(jià)。為了研究基于配體的化學(xué)性質(zhì),已經(jīng)使用CATALYST程序建立了各種成功的實(shí)驗(yàn)。此外,利用人工智能研究人員可以確定用于與疾病相關(guān)的特定靶點(diǎn)的生物活性化合物。例如,Wu等人利用集成DL和RF的方法設(shè)計(jì)了WDL-RF用于測(cè)定靶向配體的G蛋白偶聯(lián)受體(GPCRs)的生物活性。

 

5.5 蛋白質(zhì)折疊和蛋白質(zhì)相互作用的預(yù)測(cè)

 

分析蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)對(duì)于藥物開發(fā)和發(fā)現(xiàn)至關(guān)重要。比如使用貝葉斯網(wǎng)絡(luò)(BN)預(yù)測(cè)PPI,其本質(zhì)是利用基因共表達(dá)、基因本體(GO)和其他生物過程相似性,集成數(shù)據(jù)集產(chǎn)生精確的PPI網(wǎng)絡(luò)。已有研究小組使用BN結(jié)合酵母菌的數(shù)據(jù)集研究出一種新的層次模型PCA集成極限學(xué)習(xí)機(jī)(PCA-EELM),該工具可以僅使用蛋白質(zhì)序列信息來預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用,提供準(zhǔn)確且快速的輸出[6]。

 

5.6 基于結(jié)構(gòu)和基于配體的虛擬篩選

 

在藥物設(shè)計(jì)和藥物發(fā)現(xiàn)中,虛擬篩選(VS)是CADD的重要方法之一,是從化合物庫中篩選出有前景的治療化合物的有效方法。作為高通量篩選的重要工具,它也帶來了成本高、準(zhǔn)確率低的問題。要將ML用于VS,應(yīng)該有一個(gè)由已知的活性和非活性化合物組成的過濾訓(xùn)練集。這些訓(xùn)練數(shù)據(jù)用于使用監(jiān)督學(xué)習(xí)技術(shù)訓(xùn)練模型。然后對(duì)訓(xùn)練的模型進(jìn)行驗(yàn)證,如果它足夠精確,則將該模型用于新的數(shù)據(jù)集,以針對(duì)目標(biāo)篩選具有所需活性的化合物。ML能夠加快VS的速度,使其更完善,甚至可以減少VS中的誤報(bào)。

 

一般來說VS分兩種,基于結(jié)構(gòu)的VS(SBVS)和基于配體的VS(LBVS)(圖5)。其中,分子對(duì)接是SBVS中應(yīng)用的主要原則,已經(jīng)開發(fā)了幾種基于AI和ML的評(píng)分算法,如NNScore、CScore、SVR-SCORE和ID-SCORE;也有算法被開發(fā)用于SBVS中的分子動(dòng)態(tài)模擬分析以及預(yù)測(cè)SBVS中蛋白質(zhì)-配體的親和力,如RFS、支持向量機(jī)、CNNs和淺層神經(jīng)網(wǎng)絡(luò)。類似的, LBVS也開發(fā)了不同的算法和工具,例如SwissSimilarity、METADOCK、HybridSim-VS、PKRank、BRUSELAS和AutoDock Bias等等。

 

人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

 

圖5 基于配體的(A)和基于結(jié)構(gòu)的(B)虛擬篩選

 

5.7 QSAR建模與藥物再利用

 

在藥物設(shè)計(jì)和開發(fā)中,研究化學(xué)結(jié)構(gòu)和理化性質(zhì)與生物活性之間的關(guān)系是至關(guān)重要的。定量構(gòu)效關(guān)系(QSAR)建模是一種計(jì)算方法,通過它可以在化學(xué)結(jié)構(gòu)和生物活性之間建立定量的數(shù)學(xué)模型。傳統(tǒng)QSAR模型大致分為兩類,回歸模型(如高斯過程GPs)和分類模型。目前已經(jīng)開發(fā)了多種基于網(wǎng)絡(luò)的工具和算法,如Vega平臺(tái)、QSAR-Co、FL-QSAR、Transformer-CNN和Chemception等,為QSAR建模提供了一條新的途徑。

 

在藥物設(shè)計(jì)和發(fā)現(xiàn)中,藥物重新定位是指對(duì)已經(jīng)針對(duì)一種疾病情況開發(fā)的藥物進(jìn)行調(diào)查,并針對(duì)其他疾病情況進(jìn)行重新定位。近年來,基于人工智能的工具和算法的出現(xiàn)為該領(lǐng)域研究提供了平臺(tái),如DrugNet、DRIMC、DPDR-CPI、PHARMGKB和DRRS等。特別是最近,新冠肺炎成為一種全球性的流行病,世界各地的研究人員開始尋找有前途的治療劑。在這方面,Hooshmand等人基于神經(jīng)網(wǎng)絡(luò)進(jìn)行藥物重新定位,確定了16種潛在的抗HCoV可再利用藥物,并為新冠肺炎確定了12個(gè)有前景的藥物靶點(diǎn)[7]。

 

人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用

 

圖6 QSAR建模(A)與藥物再利用(B)

 

5.8 理化性質(zhì)和生物活性的預(yù)測(cè)

 

眾所周知,每一種化合物都與溶解度、分配系數(shù)、電離度、滲透系數(shù)等物理化學(xué)性質(zhì)有關(guān),這可能會(huì)阻礙化合物的藥代動(dòng)力學(xué)特性和藥物靶向結(jié)合效率。因此,在設(shè)計(jì)新的藥物分子時(shí),必須考慮化合物的物理化學(xué)性質(zhì)。為此,已經(jīng)開發(fā)了不同的基于人工智能的工具來預(yù)測(cè)這些性質(zhì),包括分子指紋、SMILES格式、庫侖矩陣(Coulomb matrices)和勢(shì)能測(cè)量,這些都用于DNN訓(xùn)練階段。

 

此外,藥物分子的治療活性取決于其與受體或靶點(diǎn)的結(jié)合效率,因此,預(yù)測(cè)化學(xué)分子與治療靶點(diǎn)的結(jié)合親和力對(duì)于藥物的發(fā)現(xiàn)和開發(fā)至關(guān)重要。人工智能算法的最新進(jìn)展增強(qiáng)了該過程,使用相似性特征已經(jīng)開發(fā)了幾個(gè)基于網(wǎng)絡(luò)的工具,如ChemMapper和相似集合方法(SEA)。此外,還構(gòu)建了基于ML和DL的藥物靶標(biāo)親和力識(shí)別模型,如KronRLS、SimBoost、DeepDTA和Padme等。

 

5.9 化合物的作用方式和毒性預(yù)測(cè)

 

藥物毒性是指化學(xué)分子由于化合物的作用方式或新陳代謝方式而對(duì)生物體產(chǎn)生的不利影響。人工智能可以預(yù)測(cè)藥物分子與靶點(diǎn)結(jié)合和未結(jié)合時(shí)的效應(yīng),以及體內(nèi)安全性分析。已經(jīng)開發(fā)了不同的基于Web的工具,如LimTox、pkCSM、admetSAR和Toxtree。

 

5.10 分子通路的鑒定與多重藥理學(xué)

 

人工智能和最大似然算法在藥物發(fā)現(xiàn)和開發(fā)中的重要成果之一是預(yù)測(cè)和估計(jì)疾病網(wǎng)絡(luò)、藥物-藥物相互作用和藥物-靶點(diǎn)關(guān)系的總體拓?fù)浜蛣?dòng)力學(xué)。數(shù)據(jù)庫如DisGeNET、STRTCH、STRING分別被用于確定基因-疾病關(guān)聯(lián)、藥物-靶標(biāo)關(guān)聯(lián)和分子途徑。例如,Gu等人在2020年使用相似性集成方法確定了197種最常用中草藥的靶點(diǎn),然后使用DisGeNET數(shù)據(jù)庫將這些靶標(biāo)與不同的疾病聯(lián)系起來,從而將草藥與可用于治療的疾病聯(lián)系起來[8]。

 

在藥物化學(xué)中,多重藥理學(xué)是指在與疾病相關(guān)的藥物靶標(biāo)生物網(wǎng)絡(luò)中設(shè)計(jì)能夠與多個(gè)靶點(diǎn)相互作用的單一藥物分子。它適合于為復(fù)雜疾病,如癌癥、神經(jīng)退行性疾?。∟DDS)、糖尿病和心力衰竭等設(shè)計(jì)治療劑。由于強(qiáng)大的挖掘能力和數(shù)據(jù)分析能力,基于ML的方法具有分析牽連分子網(wǎng)絡(luò)的潛力,大大增加發(fā)現(xiàn)多靶配體的概率。此外,ML模型有助于識(shí)別具有不同結(jié)合口袋的多靶配體。

 

5.11 臨床試驗(yàn)的設(shè)計(jì)

 

在引入人工智能技術(shù)后,臨床試驗(yàn)的成功率大幅提高。IBM Watson開發(fā)了一個(gè)臨床試驗(yàn)配對(duì)系統(tǒng)[9],該系統(tǒng)使用患者的醫(yī)療記錄和大量過去的臨床試驗(yàn)數(shù)據(jù)來創(chuàng)建詳細(xì)的檔案。人工智能模型還可以通過分析毒性、副作用和其他相關(guān)參數(shù)來提高成功率,從而降低臨床試驗(yàn)的成本。

 

未來的挑戰(zhàn)和可能的解決方案

 

目前,制藥行業(yè)在開發(fā)新藥時(shí)面臨的主要挑戰(zhàn)是成本高和效率低。ML方法和DL的最新發(fā)展帶來了“降本增效”的巨大機(jī)會(huì),這也引起了各地研究人員的極大興趣,以至于許多制藥公司都與人工智能公司合作。此外,該領(lǐng)域的初創(chuàng)公司數(shù)量也在不斷攀升,到2020年6月達(dá)到了230家。

如今,人工智能在藥物發(fā)現(xiàn)領(lǐng)域被用于靶標(biāo)識(shí)別、先導(dǎo)優(yōu)化、ADME-T預(yù)測(cè)和構(gòu)建臨床試驗(yàn)等各個(gè)步驟。盡管取得了巨大的成功,但仍然存在許多挑戰(zhàn),其中有兩個(gè)最重要的問題:首先,標(biāo)記不能是二元的,因?yàn)樗幬镌谏锵到y(tǒng)中的作用是復(fù)雜的;其次,雖然數(shù)據(jù)庫擁有海量信息,但藥物發(fā)現(xiàn)中可用的高質(zhì)量數(shù)據(jù)并不多。因此,需要一個(gè)不僅能提供數(shù)據(jù)數(shù)量而且能提供質(zhì)量的平臺(tái)。在制藥行業(yè),開放數(shù)據(jù)共享并不常見,皮斯托亞聯(lián)盟(Pistoia alliance)主動(dòng)發(fā)起了一場(chǎng)運(yùn)動(dòng),鼓勵(lì)許多公司與他人共享數(shù)據(jù),在未來他們還打算建立統(tǒng)一的數(shù)據(jù)格式。

2020年12月,In silico medicine公司為他們的小分子抑制劑向FDA提出了IND申請(qǐng),他們的目標(biāo)是在2022年初進(jìn)行臨床試驗(yàn)。如果試驗(yàn)成功,那么這將是有史以來第一次通過基于人工智能的工具提出并批準(zhǔn)一種新的靶點(diǎn)及其抑制劑。盡管將人工智能工具融入藥物發(fā)現(xiàn)過程中存在一些不可避免的障礙,還有大量的工作要做,但毫無疑問,在不久的將來,人工智能將給藥物發(fā)現(xiàn)和開發(fā)過程帶來革命性的變化。

 

參考文獻(xiàn)

 

[1] Gupta, R., Srivastava, D., Sahu, M. et al. Artificial intelligence to deep learning: machine intelligence approach for drug discovery. Mol Divers (2021)

[2] Han Y, Yang J, Qian X et al (2019) DriverML: a machine learning algorithm for identifying driver genes in cancer sequencing studies. Nucleic Acids Res.

[3] Yan J, Bhadra P, Li A et al (2020) Deep-AmPEP30: improve short antimicrobial peptides prediction with deep learning. Mol Ther-Nucleic Acids 20:882–894.

[4] Zhavoronkov A, Ivanenkov YA, Aliper A et al (2019) Deep learning enables rapid identification of potent DDR1 kinase inhibitors. Nat Biotechnol 37:1038–1040.

[5] Shen Y, Liu T, Chen J et al (2020) Harnessing artificial intelligence to optimize long-term maintenance dosing for antiretroviral-naive adults with HIV-1 Infection. Adv Ther 3:1900114.

[6] You ZH, Lei YK, Zhu L et al (2013) Prediction of protein-protein interactions from amino acid sequences with ensemble extreme learning machines and principal component analysis. BMC Bioinformatics 14:1–11.

[7] Hooshmand SA, Zarei Ghobadi M, Hooshmand SE et al (2020) A multimodal deep learning-based drug repurposing approach for treatment of COVID-19. Mol Divers.

[8] Gu S, Lai L, hua, (2020) Associating 197 Chinese herbal medicine with drug targets and diseases using the similarity ensemble approach. Acta Pharmacol Sin 41:432–438.

[9] Fogel DB (2018) Factors associated with clinical trials that fail and opportunities for improving the likelihood of success: a review. Contemp Clin Trials Commun 11:156–164.

 

分享到:

來源:AIDD Pro

相關(guān)新聞: