中文字幕一级黄色A级片|免费特级毛片。性欧美日本|偷拍亚洲欧美1级片|成人黄色中文小说网|A级片视频在线观看|老司机网址在线观看|免费一级无码激情黄所|欧美三级片区精品网站999|日韩av超碰日本青青草成人|一区二区亚洲AV婷婷

您當前的位置:檢測資訊 > 科研開發(fā)

AI藥物研發(fā)之惑:我們應如何提高藥物研發(fā)的成功率

嘉峪檢測網(wǎng)        2019-04-28 09:30

在過去的3年里,我們見證了人工智能(AI)的第三波崛起,并為之折服。同樣的風潮也吹拂了相對保守的醫(yī)藥行業(yè),甚至侵入了最具技術(shù)門檻的制藥業(yè)。

 

在一些創(chuàng)業(yè)團隊的藍圖里,通過機器學習算法和虛擬研發(fā)的商業(yè)模式,可以革新目前這種“2 Billions, 20 years”低效的藥物研發(fā)過程,將新藥更快更省地帶給患者。

 

但如果把眼光從未來移開,回頭凝視歷史,我們就會發(fā)現(xiàn)AI在藥物研發(fā)中并非陌生。自80年代開始,一大批巨頭就開始推動計算機輔助藥物發(fā)現(xiàn)(Computer Aided Drug Design,CADD)。

 

大家可能知道Merck贊助了好幾次Kaggle Challenge,主題是用機器學習預測P450酶活性。但其實,人家在30多年前就開始了相關的嘗試,還登上了1981年的《財富》雜志。

 

在那個年代里,早期的計算化學家,已經(jīng)在使用KNN和SVM等算法對藥物分子中的moieties進行無監(jiān)督聚類,試圖歸納出特定藥效的特征。一些分子動力學程序也試圖用機器學習來優(yōu)化收斂速度,尤其是面對蛋白質(zhì)構(gòu)型docking的搜索時。

 

這些人工智能的思路,早就融入了商用的QSAR(Quantitive Structure Activity Relatioship,定量構(gòu)效關系 )軟件中。

 

那么這次,以深度學習為代表的AI回潮,有什么不一樣?如果這次確實不一樣,AI又能不能讓藥物研發(fā)這件越來越糟心的事情變得“不一樣”?

 

在討論AI藥物研發(fā)之前,讓我們梳理一下藥物研發(fā)的整個流程。通??梢詣澐譃槿A段:

 

Drug Discovery:了解疾病機理(或發(fā)現(xiàn)“奇跡”),識別出機理中能成藥的靶點,我稱其為“生物學”階段;

 

Drug Design :篩選出適用于靶點的lead小分子/生物大分子,設計并優(yōu)化lead的結(jié)構(gòu),然后對分子進行臨床前assay,也就是廣義的“化學”階段;

 

Drug Development:三階段的臨床試驗驗證安全性和療效,并在上市后的繼續(xù)跟進和擴展適應癥,可以稱之為“醫(yī)學”階段;

 

在這三個不同階段,研發(fā)團隊有著不同的目標函數(shù),也產(chǎn)生了不一樣的技術(shù)需求和解決這些需求的方法論。因此,AI運用于不同的階段會有非常不同的難度和效用。

 

在生物學階段,主要的目標函數(shù)是:Found (找到)

 

在最理想的情況下,生物學家能夠把疾病現(xiàn)象解釋為機理,然后按照機理去識別靶點tackle這個機理。在更實際的情況下,可以通過臨床中的特例或是一些heuristic的推理,定向識別出能用藥物tackle的靶點。

 

也就是說,雖然不清楚整個疾病機理的作用網(wǎng)絡,但作用于某些網(wǎng)絡的hub可以讓疾病伏法。這大概是最能稱之為“Magic Bullet”(神奇子彈)的情況了。

 

而在當前的醫(yī)藥研發(fā)中,生物學研發(fā)者會面對兩個越來越寬的鴻溝,一個比較明顯但是相對容易理解,一個比較隱秘但真正棘手。

 

比較明顯的鴻溝是:將機理轉(zhuǎn)化為可成藥的靶點,這并沒有理想中那么直接。我們已經(jīng)遭遇了太多完美機理無法成藥的案例,因為作用于單個機理的藥物,會受到其他未理解機理的干涉,導致預計有效的療法完全失效,或是產(chǎn)生先期不可預見的副作用。這已經(jīng)造成了大量的研發(fā)項目在早期就停滯,或者更慘的如Tau蛋白,在進入臨床后才宣告失敗。

 

而這個明顯的鴻溝背后,有一個更難的鴻溝:從生物現(xiàn)象本身的復雜性里提取可理解的機理,這比給你個CPU的電鏡照片讓你逆推出計算電路要難得多。人體在分子層面的運作本身的復雜性,很可能是超越人的理解范疇的。從某種意義上說,生物學發(fā)現(xiàn)的所有機理都只可能是局部機理,是“比特例更一般的特例”。

 

這并不意味著這些“更一般的特例”不對,但是他們的數(shù)量將會是有限的。我們已經(jīng)摘了很多容易摘的果子(Low Hanging Fruit),而在研究接下來的機理時,會面臨可理解性和可預測性之間的背離,而預測性的下降會對臨床造成困惑。

 

而現(xiàn)有的生物學研究范式里并沒有意識到這種困難,這也就不難理解,為什么本世紀以來生物學研究的可重復性大大下降了(排除掉學術(shù)不端的影響)。如果意識到生物現(xiàn)象本身的復雜性,你會發(fā)現(xiàn)“生物學解簽師”真的已經(jīng)盡力了,但是他們被誤用的統(tǒng)計學(如最近的P<0.05爭論)和網(wǎng)絡復雜性聯(lián)手給蒙了,因此得不出具有確定性又可理解的機理。

 

而這也許是藥物研發(fā)效率下降的最底層原因,我們先按下不表。

 

那么進入化學階段后,主要的目標函數(shù)就是:Optimize (優(yōu)化)

 

當AI研究者見到這個詞的時候,一定會覺得暗爽。的確,在已經(jīng)了解靶點的情況下篩選藥物分子,是最容易想到的AI能夠賦能的任務。實際上,這是計算化學和CADD已經(jīng)耕耘了幾十年的戰(zhàn)場,已經(jīng)有了很深的積攢了。

 

大部分AI新藥公司也都集中在“化學”這個階段,無論是做分子模擬,構(gòu)型預測和QSAR分析,晶型優(yōu)化,甚至繼續(xù)向下去做逆合成路線推演,或是生產(chǎn)流程優(yōu)化,都是從已有的先驗知識出發(fā),去搜尋和優(yōu)化lead compound。

 

對于這個比較成熟的過程,可能的困難不是出在算法上,因為計算化學家一直在follow最新的機器學習算法并加以應用。最頭痛的問題在于,現(xiàn)有的生化數(shù)據(jù)庫的維度和量級都有點小了,而這卻是深度學習方法較為依賴的要素。

 

想要達到ImageNet對DL的推動力,現(xiàn)有的如DeepChem, ZINC之類的庫是不夠的。更糟糕的是數(shù)據(jù)來源的可靠性不足,畢竟我們都知道garbage in, garbage out。

 

在組學和結(jié)構(gòu)生物學的數(shù)據(jù)庫未完善和矯正之前,我們很難做到足夠可靠的virtual screening,因此我非??春觅|(zhì)譜和冷凍電鏡的大規(guī)模應用,這相當于互聯(lián)網(wǎng)出現(xiàn)之前的全美光纖建設,是基礎。

 

當然,ab initio直接計算出新的分子結(jié)構(gòu),也許可以對真實數(shù)據(jù)做一些補充,但是這種方法依然受限于已有的分子庫本身的數(shù)據(jù)結(jié)構(gòu)。

 

但更讓人困惑的是,AI算法所需要實現(xiàn)的事情,化學家們通過heuristic approach也可以有很高效的實現(xiàn),他們沒有意識到算法給自己工作帶來的顛覆性價值。

 

比方說,最奇怪的就是用深度學習來做逆合成分析,AI并沒有體現(xiàn)出比人的靈感更優(yōu)異之處,因為最終路線的實現(xiàn)更需要wet lab的實踐而不是圖上推演。AI所試圖優(yōu)化的地方,恰恰是目前人工操作最成熟,最不需要AI的地方。在這些階段玩AI,是內(nèi)卷化的競爭,能玩的空間其實很小的。

 

更何況,“化學”階段在整個藥物研發(fā)中并非是一個速度決定步驟。在這個階段任何的改進都只是邊際上的小規(guī)模提高,除非運用于速度的細微差別更重要的me-too,me-better或首仿藥中,否則能夠帶來的收益是較小的。

 

從這個角度上看,AI算法在“化學”階段更多是一個工具的角色,必須結(jié)合一些尚未成藥的新機理,或是成藥困難的靶點才可以產(chǎn)生更大的價值。

 

我們的確看到部分團隊會自建生物學團隊,從機理出發(fā)來全程開發(fā)lead直到賣給藥企。但問題在于,你首先要有個牢靠的生物學機理作為出發(fā)點,而這個關鍵問題卻和你自己的機器學習knowhow無關。這是一個很尷尬的局面。

 

但我認為,作為一種無監(jiān)督無先驗知識的學習過程,機器學習真正最顛覆的地方,應該是在對人類未知機理的情況下尋找能夠tackle疾病的藥物分子,而并不需要給出人類可以理解的機理。這很有難度,但是卻是最值得探索的地方,因為在機理明確的情況下藥物的發(fā)現(xiàn)只是一個速度快不快的問題,而機理未知的情況下則是從零到一的問題?,F(xiàn)在真正阻礙藥物研發(fā)效率的,是后者!如果改一下克林頓當年競選的口號的話,那么我可以說:“It’s biology, stupid!”

 

但是biology是一個Hard Problem,而現(xiàn)在,很少有AI制藥團隊把目標設定在那里。

 

而到了醫(yī)學階段,主要的目標函數(shù)會變成:Verify(驗證)

 

如果說化學階段的目的是Be better的話,那么醫(yī)學階段的目標似乎又收縮了,變成了Be usable,然而真實的情況是大部分藥物分子跨不過這個坎。在藥物研發(fā)里有個諺語,叫做“Fail fast, Fail early”,這其實是求之不得的事情,因為如果拖到臨床II期甚至III期臨床再失敗,將會造成摧毀整個公司市值的重大損失。

 

這看起來似乎是荒謬的,如果前期的生物學機理和化學優(yōu)化已經(jīng)完善,為什么放到真人身上就砸了呢。但這個荒謬背后的原因是非常深刻的:藥物分子在復雜的人體系統(tǒng),尤其是具有基因和組學異質(zhì)性的人群中的效應是難以捉摸的,在不同的維度上可以呈現(xiàn)出不同的usability。

 

大部分的藥物如果是在II期及之后失敗,最大的問題可能不是因為藥不好,而是以錯誤的方式用在了錯誤的人群中。很多藥物其實在臨床試驗里并沒有死透,如果我們知道自己錯在那里,其實是有可能通過給藥方案和適用范圍的調(diào)整,達到新的臨床終點。

 

如果能夠及時止損,及時選擇合適的適應癥,提高成功率的話,這才是真正值錢的地方。而這其實可以借助于機器學習對患者畫像的洞察來實現(xiàn),在臨床試驗開始之前就對這個藥在大人群中的可用性,或是對哪些細分marker的人群可用,以及最重要的,哪些marker人群和臨床終點無效做出判斷。這樣的洞見,在II期及以后的臨床試驗中都價值上億!

 

可以看到,目前的藥物研發(fā)的流程,最大的矛盾集中在生物學階段和醫(yī)學階段,相反,化學階段反而是最成熟的部分。而如果只是在這個非瓶頸部分做優(yōu)化,并不會顯著提升藥物研發(fā)的時間效率和回報率。

 

因此我認為,如果AI藥物研發(fā)的項目,僅僅是過去計算化學模擬,組學和藥物開發(fā)自動化的延續(xù),是用AI的工具去優(yōu)化和加強已有的研發(fā)流程,這當然是一個最具可行性的前期策略,但是這并不是那么值錢的市場。這些針對藥物研發(fā)中“化學”階段的AI創(chuàng)業(yè)項目,做的普遍是容易做,但不是必須做的事情。如果只是提升當前的藥物研發(fā)效率,那么AI藥物研發(fā)公司的估值,顯然有點高了。

 

大型藥企對這些創(chuàng)業(yè)項目的關注和支持,與其說是看好技術(shù)而去投資,不如說是出于財務KPI的考慮,以投資AI藥物研發(fā)公司的方式,將非藥企核心的研發(fā)業(yè)務外包給了CRO和這些“virtual biotech”的AI創(chuàng)業(yè)公司。

 

這可以輸出藥企的優(yōu)勢:充沛的現(xiàn)金流投入,和臨床開發(fā)“接盤”能力,而產(chǎn)生的收益又不會立即體現(xiàn)在損益表上,而是通過收購-商譽的調(diào)節(jié),讓報表變得更好看。當然,從投資的角度去看,我也認同這種商業(yè)邏輯。

 

但真正具有極大價值的,應該是用AI重構(gòu)藥物研發(fā)的整體邏輯,這可以從兩個方向進行努力:

 

1,在生物學的階段,甩開可理解性的限制,以無監(jiān)督學習的方式去更高效尋找新機理和有效的新靶點,往外擴張成藥的空間。

 

2,在醫(yī)學的階段,結(jié)合患者畫像參與到臨床實驗的決策中,以提高藥物定位和過審的成功概率,盡早識別并kill掉無底洞的爛藥,以免到了3期失敗被坑死。

 

這兩個方向其實都體現(xiàn)出同一個理念,那就是應該用AI去提高藥物研發(fā)的成功率,而非藥物研發(fā)的運營效率,這兩者是質(zhì)和量的不同。如果能夠直面“生物學”和“醫(yī)學”階段的Hard Problem,實現(xiàn)顛覆性創(chuàng)新,我相信,這會比在“化學”階段做的任何漸進式創(chuàng)新,都更有價值。與諸君共勉!

 

本文作者:劉正  新加坡Timbre capital分析師

 

分享到:

來源:AnyTesting

相關新聞: