您當(dāng)前的位置:檢測(cè)資訊 > 科研開(kāi)發(fā)
嘉峪檢測(cè)網(wǎng) 2024-10-10 18:08
摘要:合成生物學(xué)為生命科學(xué)研究提供了一種新的范式("構(gòu)建以學(xué)習(xí)"),并開(kāi)啟了生物技術(shù)的未來(lái)之旅("構(gòu)建以使用")。在這里,我們討論了合成生物學(xué)使能技術(shù)主流中各種原理和技術(shù)的進(jìn)步,包括基因組的合成與組裝、DNA存儲(chǔ)、基因編輯、分子進(jìn)化和功能蛋白的從頭設(shè)計(jì)、細(xì)胞與基因回路工程、無(wú)細(xì)胞合成生物學(xué)、人工智能(AI)輔助合成生物學(xué),以及生物鑄造廠。我們還介紹了定量合成生物學(xué)的概念,它正在引導(dǎo)合成生物學(xué)朝著更高的準(zhǔn)確性和可預(yù)測(cè)性或真正的合理設(shè)計(jì)方向發(fā)展。我們得出結(jié)論,合成生物學(xué)將通過(guò)使能技術(shù)的迭代發(fā)展和核心理論的成熟,建立其學(xué)科體系。
1.引言
合成生物學(xué),亦稱為工程生物學(xué),是一門新興的跨學(xué)科學(xué)科。它整合了生物科學(xué)、化學(xué)、物理、材料科學(xué)、計(jì)算機(jī)和信息科學(xué)以及工程概念,重新設(shè)計(jì)或從頭設(shè)計(jì)和構(gòu)建生物系統(tǒng),創(chuàng)造了一種被稱為“構(gòu)建以學(xué)習(xí)”的生物研究新范式,并賦予當(dāng)前生物技術(shù)一種新的動(dòng)力,稱為“構(gòu)建以使用”。合成生物學(xué)由三個(gè)相互關(guān)聯(lián)的方面組成:理論、使能技術(shù)以及應(yīng)用研究。
半個(gè)多世紀(jì)前,在理解了核酸和蛋白質(zhì)的基本結(jié)構(gòu)后,科學(xué)家們實(shí)現(xiàn)了從化學(xué)合成小分子到化學(xué)合成生物大分子的歷史性飛躍。開(kāi)創(chuàng)性的研究包括結(jié)晶牛胰島素的全合成、遺傳密碼的多核苷酸合成以及氨基酸轉(zhuǎn)移酶 RNA。世紀(jì)之交,隨著人類基因組計(jì)劃的完成以及 DNA 測(cè)序和合成技術(shù)的進(jìn)步,合成生物學(xué)實(shí)現(xiàn)了從核酸合成到基因組合成的新飛躍。從簡(jiǎn)單到復(fù)雜,科學(xué)家們已經(jīng)合成了病毒基因組、細(xì)菌基因組以及酵母染色體。這些里程碑式的方法為生物系統(tǒng)的合成提供了基礎(chǔ),證明了合成基因組可以完全執(zhí)行自然生物功能。
在同一時(shí)期,工程概念被引入到生物系統(tǒng)的設(shè)計(jì)和創(chuàng)造中,例如基因電路、生物裝置和模塊、最小基因組和底盤細(xì)胞。這些概念通過(guò)許多人工邏輯生物裝置和基因組得到了很好的解釋,例如基因開(kāi)關(guān)、合成轉(zhuǎn)錄調(diào)節(jié)因子的振蕩網(wǎng)絡(luò)、基于群體感應(yīng)的細(xì)胞間通信電路、用于程序化模式形成的合成多細(xì)胞系統(tǒng)、執(zhí)行邏輯運(yùn)算的 RNA 裝置以及可編程的微生物殺傷開(kāi)關(guān)。這些開(kāi)創(chuàng)性的探索旨在實(shí)現(xiàn)生物組件的標(biāo)準(zhǔn)化、底盤細(xì)胞的通用化,以及基于工程原理設(shè)計(jì)生物系統(tǒng)的可預(yù)測(cè)性。
然而,由于生物系統(tǒng)的遺傳變異、代謝多樣性和動(dòng)態(tài)性以及生物量的靈活性,它們是極其復(fù)雜的系統(tǒng)。我們?yōu)樯镌O(shè)計(jì)所獲得的知識(shí)遠(yuǎn)遠(yuǎn)不足以滿足工程標(biāo)準(zhǔn)。高通量、多周期和自動(dòng)化的“試錯(cuò)”生物鑄造廠應(yīng)運(yùn)而生,其效率正通過(guò)嵌入人工智能(AI)而得到極大提升。特別是,DeepMind 的 AlphaFold和 Baker 實(shí)驗(yàn)室的 RoseTTAFold等高級(jí)算法已經(jīng)徹底改變了蛋白質(zhì) 3D 結(jié)構(gòu)的預(yù)測(cè)。這意味著 AI 輔助的蛋白質(zhì)從頭設(shè)計(jì)將會(huì)蓬勃發(fā)展。
結(jié)果,我們可以區(qū)分兩種運(yùn)作方式:數(shù)據(jù)驅(qū)動(dòng)的“黑箱”和知識(shí)驅(qū)動(dòng)的“白箱”。大量的知識(shí)輸入和數(shù)據(jù)輸出使我們能夠進(jìn)行計(jì)算建模,實(shí)現(xiàn)生物設(shè)計(jì)的準(zhǔn)確性和可預(yù)測(cè)性。這種建模被稱為定量合成生物學(xué),它正成為合成生物學(xué)理論的核心部分。其有效性和可靠性已在研究細(xì)菌在新可用棲息地的定殖能力和闡述大腸桿菌生長(zhǎng)與細(xì)胞周期之間的定量關(guān)系中得到證明。
2.定量合成生物學(xué)
2.1.合成生物學(xué)研究的層次結(jié)構(gòu)
生命系統(tǒng)的復(fù)雜性相當(dāng)大,這是由于它們的層次組織和相互作用層級(jí)(圖1A)。復(fù)雜系統(tǒng)所表現(xiàn)出的特性通常被稱為“涌現(xiàn)特性”,這是由于組成部分之間的相互作用而產(chǎn)生的,即使完全了解所有部分,也無(wú)法預(yù)測(cè)。例如,識(shí)別一個(gè)生物體中的基因和蛋白質(zhì)就像列出飛機(jī)的所有部件一樣,這并不足以理解飛機(jī)是如何飛行的。因此,理解生命屬性如何在層次組織中涌現(xiàn)仍然是生命科學(xué)中最基本問(wèn)題之一。
利用生物學(xué)和工程原理,合成生物學(xué)旨在設(shè)計(jì)生物模塊/反應(yīng)/系統(tǒng)以實(shí)現(xiàn)所需的功能/產(chǎn)品。從生物分子工程、基因組工程到人造細(xì)胞設(shè)計(jì),合成生物學(xué)家可以在任何層次上訪問(wèn)層次生物系統(tǒng)。在每個(gè)層次上,合成生物學(xué)家的目標(biāo)是創(chuàng)造一個(gè)更合成和復(fù)雜的入口,因此合成生物學(xué)的進(jìn)步通常導(dǎo)致最復(fù)雜和最不自然的系統(tǒng)。總的來(lái)說(shuō),合成生物學(xué)研究生命屬性如何在層次化的生命系統(tǒng)中涌現(xiàn),采用自下而上的策略,即“通過(guò)構(gòu)建來(lái)理解”。
正如理查德·P·費(fèi)曼(Richard P. Feynman)著名的論斷:“我們不能創(chuàng)造的,我們就不能理解。”
合成生物學(xué)已被證明是探索生命屬性所有三個(gè)維度的有價(jià)值工具,即以前存在過(guò)的功能、現(xiàn)在存在和尚未存在過(guò)的功能。它允許創(chuàng)造人工系統(tǒng),如基于硅的生命和單染色體酵母,以探索生命的邊界并揭示“生命是什么”的基本問(wèn)題。相比之下,這些人工系統(tǒng)可以超越自然細(xì)胞的能力,這將極大地促進(jìn)生物技術(shù)的發(fā)展,以改變我們的日常生活,即探索不存在的生命功能。通過(guò)工程/重建生物系統(tǒng),合成生物學(xué)使我們能夠從傳統(tǒng)生物學(xué)中提取不可接近的信息,并幫助我們理解生命原理(現(xiàn)有功能)。最后,合成生物學(xué)家通過(guò)簡(jiǎn)化和建模研究復(fù)雜生物系統(tǒng)。這些努力推進(jìn)了我們對(duì)其底層物理的理解,這將有助于闡明早期地球環(huán)境中可能的進(jìn)化路徑(現(xiàn)有功能)。
盡管在理解生命系統(tǒng)方面取得了相當(dāng)大的進(jìn)展,但仍然缺少一種成熟的合成生物學(xué)方法。為了解決這個(gè)問(wèn)題,我們首先總結(jié)了以前系統(tǒng)的一般范式。一個(gè)綜合生物學(xué)研究實(shí)踐通常包括三個(gè)層次,稱為部分、拓?fù)浜凸δ?。功能?lái)自部分,但在復(fù)雜系統(tǒng)中,很難獲得它們之間的端到端關(guān)系。因此,增加了一個(gè)拓?fù)渲虚g層。拓?fù)淙绾螐牟糠种杏楷F(xiàn)被稱為機(jī)制,功能如何從拓?fù)渲杏楷F(xiàn)被稱為原理(圖1B)。原理更通用,而機(jī)制特定于所使用的部分。例如,艾倫·圖靈(Alan Turing)提出了反應(yīng)-擴(kuò)散原理,這在自然界廣泛調(diào)節(jié)模式形成?;谶@一通用原理,研究人員構(gòu)建了化學(xué)Belousov-Zhabotinsky反應(yīng)、生物晝夜節(jié)律振蕩和工程DNA/酶反應(yīng)網(wǎng)絡(luò)的人工反應(yīng)-擴(kuò)散系統(tǒng),以遵循它們各自的機(jī)制。因此,理解這些原理為合理設(shè)計(jì)奠定了基礎(chǔ),這反過(guò)來(lái)加速了合成生物學(xué)向增加復(fù)雜性和效率的方向發(fā)展,推進(jìn)了我們對(duì)生命系統(tǒng)基本原理的理解(圖1C)。我們稱之為合理設(shè)計(jì)的理想合成生物學(xué)實(shí)踐,是基于興趣原理設(shè)計(jì)基本組件以實(shí)現(xiàn)預(yù)期功能。

圖1 通過(guò)定量合成生物學(xué)理解功能出現(xiàn)。A,在生命系統(tǒng)的層次組織中出現(xiàn)的功能,僅通過(guò)了解單個(gè)部分是無(wú)法理解的。B,方法論的層次結(jié)構(gòu)。C,定量合成生物學(xué)研究中的原則和合理設(shè)計(jì)相互促進(jìn)。所提出的定量合成生物學(xué)研究范式整合了合理設(shè)計(jì)、構(gòu)建和測(cè)試。
2.2.定量合成生物學(xué):研究功能涌現(xiàn)的研究范式
成功的合理設(shè)計(jì)僅限于少數(shù)特征明確的系統(tǒng),例如早期研究中的切換開(kāi)關(guān)和振蕩器。近期的例子包括通過(guò)形態(tài)素介導(dǎo)的人工細(xì)胞分化以及能夠?qū)崿F(xiàn)光動(dòng)力二氧化碳固定的人工光合作用系統(tǒng)。然而,感興趣的生物學(xué)功能的原則常常難以捉摸。在這種情況下,研究人員可以根據(jù)對(duì)感興趣功能的定量分析設(shè)計(jì)新的原則,然后進(jìn)行測(cè)試;或者他們可以依賴于定義明確的組件并進(jìn)行微調(diào)以探索其潛在功能。因此,當(dāng)一個(gè)功能的合理性未知時(shí),合成生物學(xué)研究中的常規(guī)工作涉及繁瑣的試錯(cuò)和在微調(diào)中的運(yùn)氣。盡管這種試錯(cuò)研究范式在產(chǎn)生關(guān)鍵信息和擴(kuò)展我們對(duì)復(fù)雜生物系統(tǒng)的理解方面取得了成功,但在未來(lái)幾十年中,合成生物學(xué)的合理設(shè)計(jì)將有很高的需求,以有效探索生命系統(tǒng)的基本法則。
我們?nèi)绾卧跊](méi)有感興趣原則的情況下實(shí)現(xiàn)合理設(shè)計(jì)?合理設(shè)計(jì)一個(gè)系統(tǒng)是為了可預(yù)測(cè)性而設(shè)計(jì),即基于輸入組件和參數(shù)預(yù)測(cè)結(jié)果的能力。這要求我們量化自然現(xiàn)象,使我們擺脫定性描述的模糊性和主觀性,允許我們發(fā)展理論和進(jìn)行預(yù)測(cè)。有兩種模型指導(dǎo)我們量化自然系統(tǒng):知識(shí)驅(qū)動(dòng)的“白盒”模型和數(shù)據(jù)驅(qū)動(dòng)的“黑盒”模型。白盒模型是基于宏觀實(shí)驗(yàn)觀察建立的。通過(guò)綜合分析,我們可以將這些復(fù)雜的觀察以數(shù)學(xué)公式描述,從而提取一般的理論框架和基本原理。例如,劉等人開(kāi)發(fā)了一個(gè)由多個(gè)偏微分方程組成的反應(yīng)-擴(kuò)散模型,描述了細(xì)菌菌落范圍擴(kuò)展系統(tǒng)中的細(xì)胞生長(zhǎng)、細(xì)胞移動(dòng)等,再現(xiàn)了該系統(tǒng)中自發(fā)出現(xiàn)的時(shí)空模式;鄭等人發(fā)現(xiàn)細(xì)胞質(zhì)量和染色體復(fù)制-分離速率之間存在線性關(guān)系,為理解細(xì)胞周期調(diào)控和編程細(xì)胞大小提供了定量基礎(chǔ)。特倫斯·華的團(tuán)隊(duì)制定了一些細(xì)菌生長(zhǎng)定律,并建立了蛋白質(zhì)組資源分配的原則,為理解細(xì)菌對(duì)生理擾動(dòng)的響應(yīng)和設(shè)計(jì)合成代謝途徑提供了預(yù)測(cè)模型。相比之下,黑盒建模側(cè)重于輸入和輸出之間的直接相關(guān)性。大量已知的輸入和輸出數(shù)據(jù)將被用來(lái)訓(xùn)練和改進(jìn)算法,然后可以用來(lái)預(yù)測(cè)相關(guān)系統(tǒng)的結(jié)果。例如,DeepMind開(kāi)發(fā)的AlphaFold成功預(yù)測(cè)了98.5%的人類蛋白質(zhì)結(jié)構(gòu),這些是基于已知的氨基酸序列-蛋白質(zhì)結(jié)構(gòu)關(guān)系訓(xùn)練的。
白盒和黑盒建模都被證明是生物設(shè)計(jì)中的有價(jià)值工具:通過(guò)開(kāi)發(fā)機(jī)制模型和系統(tǒng)分析模型,周等人識(shí)別了能夠?qū)崿F(xiàn)自發(fā)細(xì)胞極化的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。根據(jù)模型的預(yù)測(cè),他們成功構(gòu)建了在酵母中產(chǎn)生極化蛋白質(zhì)分布的合成基因回路。陸等人開(kāi)發(fā)了一種機(jī)器學(xué)習(xí)算法,預(yù)測(cè)PET(一種主要類型的塑料)水解酶如何突變以提高它們的效率和魯棒性。在該算法的指導(dǎo)下,團(tuán)隊(duì)對(duì)野生型酶進(jìn)行了工程改造,并獲得了一種具有更優(yōu)越PET降解活性的突變體。盡管采取了不同的途徑,但兩種方法都旨在通過(guò)定量關(guān)系構(gòu)建自然現(xiàn)象,實(shí)現(xiàn)預(yù)測(cè)性設(shè)計(jì)。因此,我們提出了定量合成生物學(xué)的概念,作為當(dāng)前合理設(shè)計(jì)瓶頸的緊迫研究范式。
定量合成生物學(xué)是定量生物學(xué)和合成生物學(xué)的交叉點(diǎn)。它從底層研究合成生物學(xué)系統(tǒng),并使用簡(jiǎn)化的定量關(guān)系描述復(fù)雜的生物現(xiàn)象。在白盒和黑盒建模的指導(dǎo)下,可以獲得對(duì)生命系統(tǒng)的定量理解,從而我們可以發(fā)展復(fù)雜生物系統(tǒng)的理論并探索它們的基本法則。對(duì)基本原理的理解將促進(jìn)合理設(shè)計(jì),從而加速實(shí)現(xiàn)真正的合成生物學(xué)工程。白盒和黑盒建模都涉及大量數(shù)據(jù),這可以通過(guò)建立自動(dòng)化和高通量的實(shí)驗(yàn)設(shè)施以及標(biāo)準(zhǔn)化的協(xié)議、算法和工作流程(測(cè)試)來(lái)實(shí)現(xiàn)。最后,應(yīng)進(jìn)一步發(fā)展使能技術(shù)以精確控制/重建生物系統(tǒng),如高效準(zhǔn)確的DNA合成技術(shù)、基因組編輯、基因回路設(shè)計(jì)和蛋白質(zhì)定向進(jìn)化(構(gòu)建)。因此,我們提出了合成生物學(xué)的未來(lái)研究范式,包括設(shè)計(jì)、構(gòu)建和測(cè)試(圖1C)。我們?cè)O(shè)想這個(gè)研究周期將徹底改變當(dāng)前定性、描述性和有限的合成生物學(xué)研究,進(jìn)入一個(gè)具有定量、理論和系統(tǒng)特征的新階段。這場(chǎng)革命將通過(guò)回答關(guān)于生命功能如何運(yùn)作的基本問(wèn)題,推動(dòng)生物學(xué)的前沿,這反過(guò)來(lái)將幫助我們?cè)O(shè)計(jì)具有更好預(yù)測(cè)能力的合成系統(tǒng)。
3.合成和組裝基因組
3.1.基因組合成的簡(jiǎn)史
合成基因組學(xué)的歷史可以追溯到1970年,當(dāng)時(shí)經(jīng)過(guò)5年的努力合成了77個(gè)堿基對(duì)的酵母tRNA基因。2002年,化學(xué)構(gòu)建了一個(gè)7.5 kb的脊髓灰質(zhì)炎病毒互補(bǔ)DNA。一年后,僅用兩周時(shí)間就創(chuàng)造了5.5 kb的X174噬菌體基因組。受到這一成功的鼓舞,一些研究小組開(kāi)始構(gòu)建583 kb的Mycoplasma genitalium JCVI-1.0基因組,并于2008年完成。隨后,合成了1.1 Mbp的Mycoplasma mycoides JCVI-syn1.0基因組并證明其功能。到目前為止,合成基因組大多模仿了自然模板DNA。2016年,科學(xué)家們使用三個(gè)設(shè)計(jì)-構(gòu)建-測(cè)試周期將1.1 Mbp的JCVI-syn1.0基因組最小化為功能性的531 kbp JCVI-syn3.0。除評(píng)估基因內(nèi)容的可塑性外,基因組合成還允許重新編程遺傳密碼。2016年,設(shè)計(jì)并實(shí)驗(yàn)驗(yàn)證了一個(gè)3.97兆堿基、57個(gè)密碼子的大腸桿菌基因組,占合成基因組的63%。三年后,創(chuàng)建了一個(gè)具有61個(gè)密碼子的合成基因組的大腸桿菌變體,實(shí)現(xiàn)了整個(gè)基因組意義密碼子的首次壓縮(圖2)。在合成病毒和細(xì)菌基因組的同時(shí),啟動(dòng)了一個(gè)名為合成酵母基因組項(xiàng)目(Sc2.0)的嘗試,該項(xiàng)目現(xiàn)在接近完成,努力合成整個(gè)釀酒酵母基因組(約12 Mb,分為16條染色體),并進(jìn)行了許多改變以探索有關(guān)基因組功能的基本生物學(xué)問(wèn)題。2016年,提出了一個(gè)更雄心勃勃的項(xiàng)目,基因組編寫項(xiàng)目(GPW),以重寫千兆堿基大小的復(fù)雜基因組。然而,當(dāng)前的DNA合成能力和成本是構(gòu)建如此大基因組的主要限制因素,因此迫切需要在DNA合成和基因組組裝方面取得突破。

圖2 合成基因組學(xué)里程碑。棕色代表在病毒和細(xì)菌基因組合成方面的進(jìn)展。藍(lán)色表示在真核生物基因組合成方面的里程碑。
3.2.基因合成和基因組組裝的技術(shù)發(fā)展
3.2.1.寡核苷酸合成
目前,最常用的寡核苷酸合成技術(shù)是20世紀(jì)80年代開(kāi)發(fā)的固相磷酸酰胺化學(xué)合成方法。在這種方法中,每個(gè)核苷酸單體的添加通過(guò)去保護(hù)、偶聯(lián)、加帽和氧化的四個(gè)步驟循環(huán)進(jìn)行。然后通過(guò)去除保護(hù)基團(tuán),為下一個(gè)堿基重復(fù)該循環(huán)。這種方法的穩(wěn)健性和保真性使其能夠自動(dòng)化和工業(yè)化。自20世紀(jì)90年代以來(lái),基于這種方法的DNA合成器已經(jīng)被開(kāi)發(fā)出來(lái),同時(shí)合成96-1536個(gè)不同的寡核苷酸。相比之下,陣列基礎(chǔ)的寡核苷酸合成技術(shù)理論上可以顯著降低成本并提高產(chǎn)量。然而,作者指出,由于逐步多重反應(yīng)系統(tǒng)中不可避免的合成相關(guān)錯(cuò)誤,合成質(zhì)量通常隨著寡核苷酸長(zhǎng)度的增加而降低。盡管不斷努力優(yōu)化合成過(guò)程,合成的寡核苷酸通常不超過(guò)200 nt的長(zhǎng)度。
酶促?gòu)念^合成寡核苷酸,早在20世紀(jì)60年代就被提出,由于化學(xué)合成的長(zhǎng)度限制和危險(xiǎn)廢物問(wèn)題,已成為一個(gè)有希望的替代方案。目前,末端脫氧核糖核苷酸轉(zhuǎn)移酶(TdT)是最佳選擇。經(jīng)過(guò)多年的努力,據(jù)報(bào)道酶促合成可以產(chǎn)生約300個(gè)單體,超越了化學(xué)合成。迄今為止,已有幾家公司成立,以推進(jìn)酶促DNA合成的商業(yè)化。
實(shí)現(xiàn)未來(lái)快速、高通量按需合成長(zhǎng)的DNA分子將大大加速系統(tǒng)生物學(xué)中的設(shè)計(jì)-構(gòu)建-測(cè)試周期。
3.2.2.基因合成
基因合成中的“基因”一詞指的是一個(gè)長(zhǎng)的雙鏈DNA序列,而不是經(jīng)典定義的基因。商業(yè)合成的基因通常在200到3000個(gè)堿基對(duì)之間。互補(bǔ)的重疊單鏈寡核苷酸是組裝這種雙鏈合成DNA的原料。早期的方法是基于連接的,其中相鄰的寡核苷酸通過(guò)DNA連接酶進(jìn)行酶促連接。自從20世紀(jì)80年代聚合酶鏈反應(yīng)(PCR)發(fā)明以來(lái),PCR介導(dǎo)的方法已被廣泛用于從寡核苷酸組裝所需的DNA序列。此外,Gibson及其同事開(kāi)發(fā)了體外和體內(nèi)一步法,用于將寡核苷酸直接組裝和克隆到質(zhì)粒中。目前,上述方法已經(jīng)迭代改進(jìn),并在大多數(shù)商業(yè)和學(xué)術(shù)應(yīng)用中使用。此外,由于需要便宜的合成DNA,還開(kāi)發(fā)了使用基于微陣列的寡核苷酸池進(jìn)行基因合成的方法。
除了基因,各種應(yīng)用需要超過(guò)10 kb甚至100 kb的更長(zhǎng)DNA分子,這導(dǎo)致了開(kāi)發(fā)一系列組裝短DNA的方法,如BioBrick、BglBrick、iBrick和HVAS。然而,這些基于內(nèi)切酶的技術(shù)產(chǎn)生的“疤痕”序列可能會(huì)影響最終構(gòu)建的功能或引入不需要的變異。II型限制性內(nèi)切酶的特點(diǎn)是切割位點(diǎn)僅在識(shí)別位點(diǎn)的幾個(gè)堿基之外,使它們成為“無(wú)疤痕”組裝的理想解決方案?;谶@一原理,開(kāi)發(fā)了Golden Gate方法和工具包,并獲得了顯著的流行。此外,為了消除對(duì)限制性內(nèi)切酶的需求,已經(jīng)建立了幾種無(wú)縫組裝方法,如Gibson組裝、連接酶循環(huán)反應(yīng)、序列和連接獨(dú)立克隆、循環(huán)聚合酶擴(kuò)展克隆和酵母組裝。目前,使用哪種組裝技術(shù)是一個(gè)偏好問(wèn)題。重要的是,上述大多數(shù)方法都可以自動(dòng)化,以增加構(gòu)建長(zhǎng)合成DNA的通量。
3.2.3.基因組組裝
要合成小基因組,限制性克隆或聚合酶循環(huán)組裝(PCA)方法通常足夠,而不同工具的組合被用于構(gòu)建更大規(guī)模(超過(guò)100千堿基)的合成染色體或基因組。
盡管Gibson組裝已被報(bào)道可以組裝高達(dá)幾百千堿基的DNA分子,體外過(guò)程的效率隨著DNA長(zhǎng)度的增加而下降,使其主要成為構(gòu)建幾十千堿基合成DNA的商業(yè)化工具。相比之下,酵母組裝的上限似乎要高得多。除了在100 kb以內(nèi)或左右的DNA組裝高效率之外,一鍋酵母轉(zhuǎn)化產(chǎn)生了幾百千堿基甚至超過(guò)1 Mb的幾個(gè)合成基因組,如來(lái)自5個(gè)片段的兩個(gè)Phaeodactylum tricornutum染色體(497 kb和441 kb),使用25-25 kb片段生成的583 kb細(xì)菌基因組,使用16個(gè)兆段(38-65 kb大?。┑?86 kb Caulobacter ethensis-2.0和通過(guò)11個(gè)100 kb重疊中間體產(chǎn)生的1.08 Mb JCVI-syn1.0基因組。酵母同源重組對(duì)于組裝Sc2.0中的合成染色體也至關(guān)重要,這些染色體與其自身基因組高度相似。常規(guī)克隆、Golden Gate、Gibson組裝或酵母組裝的組合被用來(lái)生成“大塊”(30-60 kb),這些通過(guò)稱為逐步切換營(yíng)養(yǎng)缺陷以促進(jìn)整合(SwAP-In)的策略順序引入酵母中,以替換它們的天然對(duì)應(yīng)物。總的來(lái)說(shuō),這些結(jié)果突出了酵母宿主在DNA吸收和組裝方面的巨大能力。所有16個(gè)酵母染色體都可以重新組織成單一的線性或圓形染色體,這表明釀酒酵母可能能夠構(gòu)建超過(guò)10 Mb的DNA分子。
除了釀酒酵母,枯草桿菌、鼠傷寒沙門氏菌和大腸桿菌是另外三個(gè)體內(nèi)基因組組裝的宿主。通過(guò)“尺蠖”方法,一個(gè)3.5 Mb的基因組已被組裝進(jìn)枯草桿菌基因組中。使用枯草桿菌基因組(BGM)載體,一個(gè)16.3-kb的小鼠線粒體基因組和一個(gè)134.5-kb的水稻葉綠體基因組已成功通過(guò)同源重組整合到枯草桿菌基因組中。通過(guò)稱為滾動(dòng)圓周擴(kuò)增片段逐步整合(SIRCAS)的過(guò)程,一個(gè)200 kb的鼠傷寒沙門氏菌片段被合成DNA替換。在大腸桿菌中,一種基于接合的策略,結(jié)合重復(fù)復(fù)制子執(zhí)行以通過(guò)程序化重組增強(qiáng)基因組工程(REXER),使~4 Mb的重編碼基因組得以合成。
3.3.合成基因組學(xué)的展望
自下而上的基因組合成能夠同時(shí)整合密集和復(fù)雜的全基因組變化。合成基因組學(xué)不僅在生命科學(xué)中提供了寶貴的發(fā)現(xiàn)。而且還可能引發(fā)食品、醫(yī)療和化學(xué)生產(chǎn)領(lǐng)域的新工業(yè)革命。例如,合成病毒已經(jīng)改變了疫苗的設(shè)計(jì)和生產(chǎn),合成基因組正在通過(guò)用于移植的人豬器官來(lái)拯救生命。然而,目前基因合成的成本對(duì)于數(shù)百萬(wàn)個(gè)堿基對(duì)或更長(zhǎng)的基因組來(lái)說(shuō)仍然是高不可攀的。此外,還有一些技術(shù)障礙需要解決。首先,目前設(shè)計(jì)的基因組通常在大腸桿菌或釀酒酵母等微生物宿主中組裝;然而,某些DNA序列對(duì)宿主的毒性常常導(dǎo)致組裝失敗。其次,長(zhǎng)DNA片段的逐步組裝受到序列重復(fù)性的限制,例如高等真核生物中的中心粒和端粒。第三,將組裝好的DNA片段從宿主轉(zhuǎn)移到目標(biāo)生物體仍然具有挑戰(zhàn)性。目前,只有Mycoplasma的圓形基因組已成功移植。最近在高通量DNA合成和組裝技術(shù)上的發(fā)展應(yīng)該會(huì)大大加快合成基因組的構(gòu)建。使用高密度微芯片、酶促DNA合成和利用微流控技術(shù)自動(dòng)化基因組裝的新DNA合成技術(shù)的出現(xiàn)將繼續(xù)降低基因合成的成本。除了在體內(nèi)組裝大的DNA片段,還將出現(xiàn)新的體外合成和放大大DNA片段的技術(shù)。在未來(lái)五年內(nèi),預(yù)計(jì)基因合成的成本將達(dá)到1 Mb以上DNA長(zhǎng)度的0.001美元/堿基對(duì)。與此同時(shí),大約1 Mb大小的染色體可以在體外完全合成,轉(zhuǎn)移到目標(biāo)生物體并重新啟動(dòng)宿主,開(kāi)啟合成基因組學(xué)的新紀(jì)元。與基因組組裝相關(guān)的一個(gè)研究方向是基因組簡(jiǎn)化,其目標(biāo)是確定一個(gè)活生物的最小基因組。例如,克雷格·文特的團(tuán)隊(duì)移除了將近一半的結(jié)核菌基因組,以研究細(xì)胞存活所需的基因組組成?;诤铣扇旧w重排和LoxPsym介導(dǎo)的進(jìn)化(SCRaMbLE)的基因組壓縮策略揭示了至少60%的合成染色體臂(synXIIL)上的基因?qū)︶劸平湍傅募?xì)胞活性是可有可無(wú)的(Luo等人,2021)。這些研究大大改善了構(gòu)建具有最小基因組和理想屬性的微生物底盤的可行性。未來(lái)對(duì)多個(gè)合成染色體或整個(gè)基因組的基因組最小化的探索將大大擴(kuò)展我們對(duì)真核生物核心功能的認(rèn)識(shí)。
4.DNA數(shù)據(jù)存儲(chǔ)技術(shù):BT-IT融合的范例
4.1.新興的DNA數(shù)據(jù)存儲(chǔ)
信息存儲(chǔ)一直是人類文明的推動(dòng)力,是知識(shí)積累、文化傳承和技術(shù)代代相傳的必要條件。用于保存信息的技術(shù)可以追溯到古代中國(guó)造紙和結(jié)繩,以及后來(lái)歷史上的紙張和印刷。直到大約半個(gè)世紀(jì)前,基于磁光硅的存儲(chǔ)技術(shù),如硬盤、固態(tài)硬盤和磁帶,不斷改變了信息存儲(chǔ)的方式?,F(xiàn)代數(shù)據(jù)存儲(chǔ)和處理技術(shù)使人類進(jìn)入了數(shù)字時(shí)代,地球上的數(shù)字?jǐn)?shù)據(jù)總量呈指數(shù)級(jí)增長(zhǎng)。然而,當(dāng)前的存儲(chǔ)介質(zhì)正面臨一些挑戰(zhàn):密度的理論極限、持續(xù)時(shí)間短暫、高能耗和環(huán)境污染。因此,需要開(kāi)發(fā)新一代信息歸檔技術(shù)。令人驚訝的是,DNA作為保存遺傳信息的天然介質(zhì),已被發(fā)現(xiàn)是潛在的人工數(shù)據(jù)存儲(chǔ)介質(zhì),具有高密度、長(zhǎng)期耐用性和低維護(hù)成本。利用合成DNA進(jìn)行高密度和長(zhǎng)期數(shù)據(jù)存儲(chǔ)已成為一個(gè)非常有前景的研究領(lǐng)域,吸引了全球政府和產(chǎn)業(yè)投資者的極大興趣。半導(dǎo)體行業(yè)協(xié)會(huì)、國(guó)防高級(jí)研究計(jì)劃局、國(guó)家科學(xué)基金會(huì)、半導(dǎo)體研究公司和情報(bào)高級(jí)研究計(jì)劃活動(dòng)都為美國(guó)DNA數(shù)據(jù)存儲(chǔ)技術(shù)和相關(guān)半導(dǎo)體做出了貢獻(xiàn)。歐盟委員會(huì)還特別資助了DNA數(shù)據(jù)存儲(chǔ)并啟動(dòng)了地平線2020計(jì)劃。中國(guó)科協(xié)在2018年將DNA數(shù)據(jù)存儲(chǔ)列為60個(gè)重大科技工程問(wèn)題之一。中國(guó)的第十四個(gè)五年計(jì)劃明確促進(jìn)了DNA存儲(chǔ)等前沿技術(shù)的發(fā)展。微軟和西部數(shù)據(jù),以及Twist Biosciences和Illumina在2020年宣布創(chuàng)建“DNA數(shù)據(jù)存儲(chǔ)聯(lián)盟”。它的“共同目標(biāo)是發(fā)揮DNA數(shù)據(jù)存儲(chǔ)作為現(xiàn)有和新興歸檔存儲(chǔ)用例中新存儲(chǔ)介質(zhì)的全部潛力”。迄今為止,已有50多家公司和學(xué)術(shù)機(jī)構(gòu)加入了該聯(lián)盟。
4.2.DNA數(shù)據(jù)存儲(chǔ)的概念與工作模式
如圖3A所示,DNA數(shù)據(jù)存儲(chǔ)的基本概念由三個(gè)基本組成部分構(gòu)成:(i)一種編碼系統(tǒng),能夠?qū)⒍M(jìn)制字符串編碼為DNA字符串,并適應(yīng)相反的過(guò)程——將DNA字符串解碼為二進(jìn)制字符串;(ii)一種寫入裝置,能夠制造具有特定序列或結(jié)構(gòu)的實(shí)際DNA分子;(iii)一種閱讀裝置,能夠讀取DNA分子的序列。值得一提的是,到目前為止,DNA中數(shù)字信息存儲(chǔ)有兩種不同的策略。對(duì)于第一種策略,具有特定序列的DNA分子被用來(lái)記錄信息。通過(guò)從頭合成或組裝DNA分子來(lái)實(shí)現(xiàn)數(shù)據(jù)寫入。第二種策略使用預(yù)先存在的DNA分子作為數(shù)據(jù)記錄的骨干。然后,通過(guò)基因編輯或DNA雜交在雙鏈DNA(dsDNA)或單鏈DNA骨干上的預(yù)定位置存儲(chǔ)信息,以在骨干上產(chǎn)生精確的序列或結(jié)構(gòu)修飾。第一種策略提供了更高的存儲(chǔ)密度,但由于需要DNA合成,寫入成本相當(dāng)高。第二種策略預(yù)計(jì)比第一種寫入成本更低,因?yàn)樗@過(guò)了昂貴的DNA合成階段。然而,其存儲(chǔ)密度的降低可能限制了未來(lái)的應(yīng)用。因此,根據(jù)寫入、復(fù)制、存儲(chǔ)和讀取的技術(shù)細(xì)節(jié),DNA數(shù)據(jù)存儲(chǔ)技術(shù)可以分為體外“硬盤模式”和體內(nèi)“CD-ROM模式”(圖3B和C)。
圖3B展示了體外“硬盤模式”,它使用高通量DNA合成來(lái)寫入數(shù)據(jù),并具有高密度數(shù)據(jù)存儲(chǔ)的潛力,類似于普通的硬盤。這種模式下的數(shù)據(jù)寫入和讀取過(guò)程相對(duì)簡(jiǎn)單,因?yàn)闆](méi)有細(xì)胞膜屏障。然而,根據(jù)研究,體外存儲(chǔ)與DNA鏈在復(fù)制過(guò)程中的丟失、高復(fù)制成本以及整個(gè)存儲(chǔ)過(guò)程中的DNA降解有關(guān)。圖3C中的體內(nèi)“CD-ROM模式”使用人工染色體來(lái)存儲(chǔ)和分發(fā)大量數(shù)據(jù)。這種體內(nèi)模型具有一個(gè)保護(hù)性環(huán)境,在其中自然出現(xiàn)了高效的復(fù)制和修復(fù)酶系統(tǒng),這在耐用性、保真度和低復(fù)制成本方面具有顯著優(yōu)勢(shì)。與體外“硬盤模式”相比,“CD-ROM模式”的主要優(yōu)勢(shì)是染色體DNA作為細(xì)胞復(fù)制的一部分,其低成本、可靠的復(fù)制可以用來(lái)快速、低成本的數(shù)據(jù)復(fù)制和傳播。此外,體內(nèi)存儲(chǔ)通過(guò)構(gòu)建復(fù)雜的細(xì)胞內(nèi)生物電路,如通過(guò)基因編輯進(jìn)行隨機(jī)讀寫、加密和解密,以及與生物信息流的通信,更容易實(shí)現(xiàn)更高級(jí)的存儲(chǔ)功能。這些額外的選項(xiàng)為體內(nèi)模式開(kāi)辟了更多可能性,允許更廣泛的潛在應(yīng)用場(chǎng)景,如細(xì)胞事件記錄、環(huán)境毒素檢測(cè)和疾病標(biāo)記監(jiān)測(cè)。

圖3 DNA數(shù)據(jù)存儲(chǔ)的基本概念和存儲(chǔ)模式。A, DNA數(shù)據(jù)存儲(chǔ)的基本概念。為實(shí)現(xiàn)基本的數(shù)據(jù)寫入和讀取操作,DNA數(shù)據(jù)存儲(chǔ)需要編碼系統(tǒng)、寫入設(shè)備和讀取設(shè)備這三個(gè)基本組成部分。B, 基于體外合成和測(cè)序大量DNA片段的“硬盤模式”。C, 基于體內(nèi)染色體DNA操作的“CD-ROM模式”(參考Chen等人,2021b的圖重新繪制)。兩種存儲(chǔ)模式的詳細(xì)信息在正文中有描述。
4.3.DNA數(shù)據(jù)存儲(chǔ)的主要進(jìn)展和現(xiàn)狀
體外“硬盤模式”的可行性已在實(shí)驗(yàn)室規(guī)模上得到證明。哥倫比亞大學(xué)的研究人員引入了噴泉碼到DNA數(shù)據(jù)存儲(chǔ)中,以提高編碼效率,防止GC富集、復(fù)雜的DNA序列難以構(gòu)建和測(cè)序。在2 MB(兆字節(jié),10^6字節(jié))的數(shù)據(jù)規(guī)模下,實(shí)現(xiàn)了高達(dá)215 PB/g DNA(PB,拍字節(jié),1×10^15字節(jié))的高存儲(chǔ)密度。2018年底,華盛頓大學(xué)的研究人員在200 MB(200兆字節(jié))的規(guī)模上實(shí)現(xiàn)了可靠的隨機(jī)數(shù)據(jù)訪問(wèn)。此外,構(gòu)建了一個(gè)完全集成的DNA存儲(chǔ)系統(tǒng),實(shí)現(xiàn)了單個(gè)單詞“hello”的自動(dòng)寫入、存儲(chǔ)和讀取。初創(chuàng)公司CATALOG采取了不同的方法,使用“DNA活字”進(jìn)行高速數(shù)據(jù)寫入。他們?cè)?019年宣布,可以在12小時(shí)內(nèi)將所有16 GB(千兆字節(jié),10^9字節(jié))的維基百科文本寫入DNA,這比其他任何當(dāng)前使用的技術(shù)快近1000倍。以色列理工學(xué)院的研究人員設(shè)計(jì)了一種復(fù)合DNA字母的概念,通過(guò)利用堿基組成信息來(lái)提高每個(gè)合成周期的寫入能力,從而最小化寫入成本。Gao等人使用等溫?cái)U(kuò)增完成了低偏差DNA鏈擴(kuò)增。天津大學(xué)的Chen等人使用低密度奇偶校驗(yàn)(LDPC)和里德-所羅門(RS)算法對(duì)總計(jì)3 MB的視頻片段和文本進(jìn)行編碼。為了解決DNA存儲(chǔ)的序列兼容性問(wèn)題,Ping等人設(shè)計(jì)了一個(gè)“陰陽(yáng)”編碼系統(tǒng)。早期的大腸桿菌DNA CD-ROM范例概念研究使用了質(zhì)粒存儲(chǔ)數(shù)據(jù)。后來(lái)的研究集中在實(shí)現(xiàn)遺傳電路,如切換開(kāi)關(guān),用于數(shù)據(jù)存儲(chǔ)。然而,這類系統(tǒng)的存儲(chǔ)容量顯然有限。Shipman等人利用CRISPR-Cas9技術(shù)在細(xì)菌細(xì)胞中存儲(chǔ)了數(shù)字電影,并使用高通量測(cè)序使它們能夠被解碼。后來(lái),Tang和Liu使用兩個(gè)CRISPR介導(dǎo)的模擬多事件記錄裝置系統(tǒng)記錄了大量細(xì)胞活動(dòng)。
最近,天津大學(xué)的Chen等人從頭設(shè)計(jì)并合成了一個(gè)長(zhǎng)度為254,886 bp的人工染色體用于數(shù)據(jù)存儲(chǔ)。這項(xiàng)研究表明,首次組裝的人工染色體可以通過(guò)可靠和低成本的細(xì)胞復(fù)制用于大規(guī)模數(shù)據(jù)分發(fā)。“萬(wàn)物DNA”、“生物正交信息存儲(chǔ)”、“真實(shí)隨機(jī)數(shù)生成”、“DNA中的數(shù)據(jù)加密”等新概念和想法也已被提出,為DNA存儲(chǔ)和計(jì)算的廣泛潛在應(yīng)用鋪平了道路。最近的一項(xiàng)綜述為這些主題提供了極好的總結(jié)。
4.4.未來(lái)展望
DNA數(shù)據(jù)存儲(chǔ)涉及一系列關(guān)鍵技術(shù),包括DNA合成、測(cè)序、微流控技術(shù)、微納米制造等,需要跨學(xué)科的努力,以實(shí)現(xiàn)將DNA存儲(chǔ)轉(zhuǎn)化為實(shí)際應(yīng)用的最終目標(biāo)。盡管之前的研究在數(shù)據(jù)量、穩(wěn)定性和隨機(jī)訪問(wèn)方面取得了顯著進(jìn)展,但成本,尤其是寫入成本,已成為DNA數(shù)據(jù)存儲(chǔ)實(shí)際應(yīng)用的主要障礙。據(jù)估計(jì),與當(dāng)前使用的基于磁帶的存儲(chǔ)技術(shù)相比,DNA數(shù)據(jù)存儲(chǔ)需要將寫入成本降低7-8個(gè)數(shù)量級(jí)。盡管有幾次嘗試,例如未終止的TdT、DNA打孔卡、DNA活字、復(fù)合DNA字母和低質(zhì)量合成,但成本降低的競(jìng)爭(zhēng)途徑仍然不明確。每種信息存儲(chǔ)介質(zhì)在其早期階段都面臨著相同的高生產(chǎn)成本挑戰(zhàn)。
現(xiàn)代存儲(chǔ)技術(shù)已根據(jù)摩爾定律廣泛使用了幾十年。值得一提的是,DNA合成和測(cè)序,作為DNA數(shù)據(jù)存儲(chǔ)的兩項(xiàng)關(guān)鍵技術(shù),其發(fā)展速度超過(guò)了摩爾定律的預(yù)測(cè)。在DNA存儲(chǔ)的簡(jiǎn)短歷史中,自從Church等人在2012年首次發(fā)表基于芯片的DNA數(shù)據(jù)存儲(chǔ)以來(lái),數(shù)據(jù)量已經(jīng)擴(kuò)大了300多倍,顯示出快速上升的趨勢(shì)。
總之,作者認(rèn)為,隨著酶促DNA合成、數(shù)據(jù)寫入和讀取方法的不斷發(fā)展,實(shí)用的DNA數(shù)據(jù)存儲(chǔ)技術(shù)將在未來(lái)幾年內(nèi)實(shí)現(xiàn)。作為一種環(huán)保、高容量、長(zhǎng)期存儲(chǔ)介質(zhì),DNA預(yù)計(jì)將彌補(bǔ)當(dāng)前存儲(chǔ)介質(zhì)的不足。
5.基因編輯
在生命科學(xué)領(lǐng)域,長(zhǎng)期以來(lái)一直有一個(gè)目標(biāo),即能夠以編程方式、特異性和高效地編輯所有活細(xì)胞的DNA序列,這在基因研究、基因治療、遺傳育種和合成生物學(xué)中具有無(wú)限的價(jià)值。以前的方法,如巨型核酸酶、鋅指核酸酶(ZFNs)和轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(TALENs),依賴于復(fù)雜和特定的蛋白質(zhì)-DNA相互作用,將蛋白質(zhì)效應(yīng)子定位到所需的DNA序列。雖然這些方法在針對(duì)特定位點(diǎn)方面是有效的,但要快速而簡(jiǎn)單地重新編程這些蛋白質(zhì)結(jié)構(gòu)域以針對(duì)新的基因組位點(diǎn)是困難的。成簇的規(guī)律間隔短回文重復(fù)序列(CRISPR)系統(tǒng)的發(fā)現(xiàn)和工程引發(fā)了基因組編輯領(lǐng)域的新而激動(dòng)人心的復(fù)興。
5.1.嚴(yán)格基于蛋白質(zhì)的基因組編輯系統(tǒng)
巨型核酸酶、ZFNs和TALENs是強(qiáng)大的生物學(xué)工具,可用于基因組編輯(圖4A)。

圖4 基因組編輯技術(shù)的概覽。A, 基于核酸酶的基因組編輯技術(shù),針對(duì)DNA,包括巨型核酸酶、ZFNs(鋅指核酸酶)、TALENs(轉(zhuǎn)錄激活因子效應(yīng)子核酸酶)、CRISPR-Cas9、CRISPR-Cas12以及新的小型Cas變體。B, 精確DNA基因組編輯技術(shù),包括胞嘧啶堿基編輯器、腺嘌呤堿基編輯器和首要編輯器。C, RNA編輯技術(shù),包括CRISPR-Cas13、CRISPR-Cas7-11,以及像REPAIR、RESCUE等RNA堿基編輯方法和其他無(wú)Cas的RNA編輯方法。
巨型核酸酶(也稱為歸巢內(nèi)切核酸酶)是大型蛋白質(zhì)復(fù)合物,可識(shí)別特定的DNA序列。這些蛋白質(zhì)依賴于蛋白質(zhì)本身與目標(biāo)DNA序列之間的復(fù)雜相互作用網(wǎng)絡(luò)。盡管以前的努力已成功地將巨型核酸酶應(yīng)用于新的、用戶定義的基因組序列,但這一過(guò)程極其繁瑣、耗時(shí)且技術(shù)上具有挑戰(zhàn)性。巨型核酸酶的應(yīng)用從根本上依賴于大規(guī)模重新編程整個(gè)蛋白質(zhì)復(fù)合物,使其能夠識(shí)別感興趣的新DNA區(qū)域。因此,迫切需要使用需要變體庫(kù)的高通量方法來(lái)識(shí)別針對(duì)新定義的蛋白質(zhì)序列的新變體。因此,需要更可編程的方法用于熱穩(wěn)定的DNA靶向。
鋅指蛋白是能夠識(shí)別特定三個(gè)DNA堿基序列的小蛋白質(zhì)模塊。這些蛋白質(zhì)在自然界中很常見(jiàn),以前的研究已經(jīng)確定了決定特定3個(gè)堿基對(duì)DNA結(jié)合序列的單個(gè)鋅指模塊的關(guān)鍵組成部分。可以將模塊化鋅指陣列融合在一起,以實(shí)現(xiàn)基于特定DNA序列的DNA靶向。此外,研究人員巧妙地將這些參與DNA靶向的較大的鋅指蛋白與FokI蛋白融合,F(xiàn)okI蛋白可以切割DNA。為了最小化活細(xì)胞中所有不需要的隨機(jī)DNA切割,研究人員巧妙地將FokI蛋白分成兩半,每半都使用特定的鋅指招募到DNA的目標(biāo)區(qū)域。因此,兩個(gè)鋅指核酸酶(ZFNs)的結(jié)合可以特異性和精確地切割DNA。這些ZFNs已在人類、動(dòng)物和植物細(xì)胞中顯示出功能,因此在可編程基因組編輯中發(fā)揮重要作用。
在發(fā)現(xiàn)鋅指蛋白之后,研究人員從植物病原體中鑒定出轉(zhuǎn)錄激活因子樣(TAL)效應(yīng)物。與ZFs不同,每個(gè)TAL效應(yīng)物(TALE)結(jié)合一個(gè)DNA堿基。這種效應(yīng)可以被編程以結(jié)合特定的DNA序列。TALE與FokI二聚體結(jié)合,生成TALE核酸酶(TALENs),這是一種完全基于蛋白質(zhì)的可編程基因組編輯技術(shù)。與ZFNs相比,TALENs表現(xiàn)出更好的編程能力,因?yàn)槊總€(gè)DNA堿基由一個(gè)單獨(dú)的單元識(shí)別,而不是鋅指的三聯(lián)體編碼特性,但TALENs比ZFNs更大,因此傳遞仍然是具有挑戰(zhàn)性的。此外,需要構(gòu)建蛋白質(zhì)復(fù)合物,當(dāng)尋求廣泛編輯活細(xì)胞的基因組時(shí),這并不容易。
5.2.CRISPR-Cas系統(tǒng)
在研究細(xì)菌基因組時(shí),研究人員發(fā)現(xiàn)了一種名為成簇規(guī)律間隔短回文重復(fù)序列(CRISPR)陣列的重復(fù)DNA序列。通過(guò)隨后的研究,研究人員證明CRISPR陣列及其附近的蛋白質(zhì),CRISPR相關(guān)(Cas)蛋白,作為細(xì)菌針對(duì)外來(lái)入侵核酸的免疫系統(tǒng)。當(dāng)細(xì)菌暴露于病原體DNA片段時(shí),免疫系統(tǒng)分離一小部分外來(lái)DNA,并將其序列整合到細(xì)菌基因組中的CRISPR陣列本身。這一發(fā)現(xiàn)對(duì)于CRISPR-Cas作為革命性基因組編輯技術(shù)的發(fā)展至關(guān)重要。
CRISPR陣列被鑒定為編碼與Cas蛋白相關(guān)的RNA序列,并針對(duì)DNA中的基于間隔序列的核酸序列。隨后的工程證明,CRISPR RNA中的靶向序列可以被輕易替換并用用戶定義的序列編程(圖4A),這將完全改變并重新編程Cas蛋白的靶向序列。這一發(fā)現(xiàn)在基因組編輯領(lǐng)域發(fā)揮了重要作用,因?yàn)檫@是第一次基因組編輯試劑可以通過(guò)替換核酸序列輕易重新編程,不同于以往需要復(fù)雜和高通量蛋白質(zhì)工程的方法。一旦與目標(biāo)DNA序列結(jié)合,Cas蛋白就會(huì)啟動(dòng)雙鏈DNA的切割,從而在活細(xì)胞的基因組中造成損傷。
5.3.新的CRISPR蛋白
Cas蛋白是CRISPR基因組編輯技術(shù)的關(guān)鍵組成部分?;撴溓蚓⊿p)Cas9是第一個(gè)用于基因組編輯應(yīng)用的工程化Cas蛋白,并且在開(kāi)發(fā)新的編輯技術(shù)時(shí)仍將被廣泛使用。所有Cas蛋白已知需要一個(gè)原間隔子相鄰基序(PAM),這是一小塊直接位于目標(biāo)基因組位點(diǎn)旁邊的DNA。Cas蛋白的這種靶向范圍限制在嘗試在細(xì)胞基因組的其他位置進(jìn)行編輯時(shí)仍然是一個(gè)挑戰(zhàn)。研究人員已經(jīng)發(fā)現(xiàn)了大量具有不同PAM要求的新Cas蛋白,從而擴(kuò)大了CRISPR基因組編輯技術(shù)的靶向范圍。此外,蛋白質(zhì)工程和定向進(jìn)化的努力已成功改變了Cas蛋白的PAM要求,這有助于利用CRISPR Cas開(kāi)發(fā)一系列基因組目標(biāo)。
最近,許多新的小型Cas蛋白被發(fā)現(xiàn)。SpCas9的長(zhǎng)度為1368個(gè)氨基酸,這在堿基編輯器和引導(dǎo)編輯器中通過(guò)效應(yīng)蛋白進(jìn)一步延長(zhǎng)?;蚪M編輯蛋白的穩(wěn)定性和傳遞受到增加長(zhǎng)度的負(fù)面影響。新的CRISPR-Cas蛋白,如Cas12f,以前稱為Cas14,CasΦ,CasX,比以前發(fā)現(xiàn)的許多Cas蛋白更?。▓D4A)。然而,需要進(jìn)一步的工程、發(fā)現(xiàn)和進(jìn)化努力來(lái)提高這些新Cas蛋白的編輯效率。
5.4.遺傳敲除
巨型核酸酶、ZFNs、TALENs和DNA靶向CRISPR-Cas系統(tǒng)都通過(guò)切割雙鏈DNA來(lái)運(yùn)作。在產(chǎn)生DNA雙鏈斷裂(DSBs)后,細(xì)胞的內(nèi)源性修復(fù)機(jī)制迅速修復(fù)這些損傷。完美的修復(fù)可以作為額外編輯的基質(zhì),直到非同源末端連接(NHEJ)或微同源介導(dǎo)的末端連接(MMEJ)修復(fù)在目標(biāo)位點(diǎn)周圍產(chǎn)生隨機(jī)小的DNA插入或刪除(INDELs)。INDEL導(dǎo)致基因敲除,這在某些情況下很有用,但缺乏精確性。同源定向修復(fù)(HDR)是一種競(jìng)爭(zhēng)性修復(fù)過(guò)程,其中使用核酸供體模板來(lái)修復(fù)DNA。盡管可編程,但HDR與NHEJ/MMEJ修復(fù)相比極其低效。因此,需要新的基因組編輯技術(shù)來(lái)高效、精確地編輯DNA序列。
5.5.堿基編輯
堿基編輯是一種可編程、高效且精確的基因組編輯技術(shù),它建立在將DNA結(jié)合蛋白定位到感興趣序列的能力上。設(shè)計(jì)的第一類堿基編輯器稱為胞嘧啶堿基編輯器(CBEs),利用Cas蛋白結(jié)合并解開(kāi)目標(biāo)區(qū)域的DNA成單鏈DNA狀態(tài)的能力(圖4B)。CBEs由一個(gè)單鏈特異性胞嘧啶脫氨酶組成,該酶與Cas蛋白融合,通過(guò)Cas蛋白靶向的內(nèi)源性DNA區(qū)域進(jìn)行脫氨。DNA中胞嘧啶堿基的脫氨會(huì)產(chǎn)生尿嘧啶,尿嘧啶可以通過(guò)復(fù)制和修復(fù)被細(xì)胞內(nèi)過(guò)程轉(zhuǎn)化為胸腺嘧啶。為了提高編輯效率,CBE還包括尿嘧啶糖苷酶抑制劑(UGI),以抑制細(xì)胞內(nèi)尿嘧啶N-糖苷酶(UNG),該酶特異性識(shí)別細(xì)胞基因組中尿嘧啶堿基的存在。局部UGI的存在將延長(zhǎng)尿嘧啶中間體的壽命,從而促進(jìn)修復(fù)后胸腺嘧啶的永久性整合。
為了進(jìn)一步促進(jìn)編輯,Cas蛋白被轉(zhuǎn)化為一種切口酶,它切割與被編輯鏈相對(duì)的鏈,使用含有新堿基編輯尿嘧啶的DNA的對(duì)側(cè)鏈作為修復(fù)模板,操縱細(xì)胞修復(fù)機(jī)制來(lái)替換被切割的痕跡鏈。這最終實(shí)現(xiàn)了從一條DNA鏈到兩條DNA鏈的永久性編輯,顯著提高了堿基編輯的效率。
腺嘌呤堿基編輯器(ABE)是開(kāi)發(fā)的第二類堿基編輯器。ABE由一種實(shí)驗(yàn)室進(jìn)化的腺苷脫氨酶組成,該酶將DNA中的腺嘌呤堿基轉(zhuǎn)換為肌苷(圖4B)。肌苷隨后被細(xì)胞內(nèi)聚合酶識(shí)別為鳥嘌呤。先進(jìn)的定向進(jìn)化方法進(jìn)一步提高了編輯效率,并擴(kuò)展了腺嘌呤堿基編輯的用途。
最初的堿基編輯方法使用Cas蛋白解開(kāi)DNA,暴露單鏈DNA序列作為脫氨的底物。一類新的堿基編輯器,稱為DddA衍生的胞嘧啶堿基編輯器(DdCBEs),利用一種自然存在的雙鏈DNA胞嘧啶脫氨酶DddA,在不解開(kāi)DNA的情況下執(zhí)行堿基編輯。DNA結(jié)合蛋白,如TALE或ZF,可以與分裂的DddAs和UGIs融合,指導(dǎo)胞嘧啶堿基編輯到目標(biāo)DNA序列,而不需要Cas蛋白。此外,通過(guò)將催化受損的DddA變體與腺嘌呤脫氨酶TadA8e融合,在人類線粒體中實(shí)現(xiàn)了目標(biāo)A到G的編輯。
CBE、ABE和DdCBE都可以精確高效地編輯DNA,以創(chuàng)建CG到TA(CBE和DdCBE)或AT到GC堿基(ABE)的轉(zhuǎn)換。然而,還有許多其他類型的基因組編輯,例如其他堿基轉(zhuǎn)換和可編程的插入和刪除,這些需要更新的精確編輯技術(shù)。
5.6.引導(dǎo)編輯
引導(dǎo)編輯是一種精確的基因組編輯技術(shù),它使用Cas蛋白結(jié)合DNA并切割DNA的一個(gè)鏈的能力(圖4B)。與堿基編輯器不同,引導(dǎo)編輯器在Cas結(jié)合后切割解開(kāi)的單鏈R環(huán)DNA。在這個(gè)鏈被特定切割后,釋放的DNA可以作為引物執(zhí)行隨后的DNA聚合。
引導(dǎo)編輯的另一個(gè)關(guān)鍵組成部分是引導(dǎo)編輯引導(dǎo)RNA(pegRNA),它編碼一個(gè)與Cas蛋白切口釋放的單鏈R環(huán)互補(bǔ)的引物結(jié)合位點(diǎn),以及編碼特定所需DNA編輯事件的模板區(qū)域。在RNA-DNA雜交之后,與Cas蛋白融合的逆轉(zhuǎn)錄酶蛋白可以使用pegRNA作為模板來(lái)擴(kuò)展基因組DNA。一個(gè)針對(duì)引導(dǎo)編輯3'區(qū)域的正交Cas蛋白引導(dǎo)RNA可以進(jìn)一步增強(qiáng)編輯。在隨后的DNA復(fù)制和修復(fù)之后,新合成的DNA序列可以永久地整合到基因組中,從而實(shí)現(xiàn)由pegRNA序列決定的可編程和多功能的編輯。引導(dǎo)編輯最初的演示編輯效率相對(duì)較低,然而,程序的后續(xù)修改,如最佳引物結(jié)合熔解溫度,使用兩個(gè)pegRNAs,DNA修復(fù)操作,RNA穩(wěn)定性基序和逆轉(zhuǎn)錄酶酶的修改已經(jīng)大大改善了引導(dǎo)編輯效率。
5.7.RNA編輯
RNA中的基因組編輯可以避免對(duì)基因組的永久性變化,從而降低非目標(biāo)DNA編輯的風(fēng)險(xiǎn)。一類針對(duì)Cas蛋白的RNA,如Cas13a和Cas7-11,可編程地靶向由CRISPR引導(dǎo)序列確定的RNA序列(圖4C)。類似于DNA堿基編輯器的發(fā)展,研究人員通過(guò)將RNA特異性腺苷脫氨酶與靶向RNA的Cas蛋白融合,開(kāi)發(fā)了RNA堿基編輯器(圖4C)。RNA特異性腺苷脫氨酶(ADAR)蛋白通過(guò)“RNA編輯與可編程的A到I替換(修復(fù))”技術(shù)與Cas13a融合,將腺嘌呤轉(zhuǎn)換為肌苷(與ABE DNA堿基類似)。同樣,能夠脫氨RNA中的胞嘧啶的工程化ADAR蛋白被用來(lái)開(kāi)發(fā)“特定CU交換的RNA編輯(RESCUE)”技術(shù),該技術(shù)將RNA中的胞嘧啶堿基轉(zhuǎn)換為尿嘧啶(與CBE DNA堿基編輯器類似)。
已經(jīng)開(kāi)發(fā)了新的不依賴CRISPR的RNA編輯系統(tǒng),通過(guò)利用RNA核酸招募內(nèi)源性蛋白質(zhì)與RNA發(fā)生化學(xué)反應(yīng)的能力,執(zhí)行位點(diǎn)特異性的RNA編輯(圖4C)。此外,一種并行技術(shù)表明,較長(zhǎng)的RNA可以自然地招募ADARs進(jìn)行RNA的A到I編輯。最近,RNA的聚集設(shè)計(jì)和環(huán)設(shè)計(jì)顯著提高了RNA編輯技術(shù)的編輯效率和特異性。
過(guò)去十年標(biāo)志著新基因組編輯技術(shù)的快速發(fā)展。從最初的基于蛋白質(zhì)的方法到如引導(dǎo)編輯這樣的精確基因組編輯技術(shù),操縱活細(xì)胞和生物體的基因組的能力越來(lái)越令人興奮。RNA編輯技術(shù)也開(kāi)始變得更精確和高效。迫切需要繼續(xù)發(fā)展更小、更精確、準(zhǔn)確和高效的基因組編輯工具,特別是在治療、農(nóng)業(yè)和生物研究等領(lǐng)域的應(yīng)用。
5.8.基因組編輯的應(yīng)用
基因組編輯技術(shù)的發(fā)展在生物醫(yī)學(xué)和農(nóng)業(yè)領(lǐng)域取得了巨大進(jìn)步。生物技術(shù)公司紛紛推進(jìn)新的基因組編輯藥物的研發(fā)。最近,研究人員在體內(nèi)基因組編輯技術(shù)方面取得了進(jìn)展,如CRISPR-Cas9和堿基編輯,用于治療鐮狀細(xì)胞性貧血、早衰癥、轉(zhuǎn)甲狀腺素淀粉樣變性或高膽固醇血癥等遺傳疾病。基因組編輯在農(nóng)業(yè)中的應(yīng)用激發(fā)了對(duì)未來(lái)生物作物育種的新興趣??共⌒院统輨┛剐允窃S多作物種類中發(fā)展最為成熟的兩個(gè)方面。最近,研究人員展示了通過(guò)四次同時(shí)多路編輯事件,成功創(chuàng)造了抗病性和產(chǎn)量增加的小麥植物。此外,許多內(nèi)源性編輯已被證明可以產(chǎn)生強(qiáng)大的除草劑抗性?;蚪M編輯將繼續(xù)促進(jìn)有價(jià)值的農(nóng)業(yè)作物品種的創(chuàng)造。
6.蛋白質(zhì)的分子進(jìn)化
體外蛋白質(zhì)分子進(jìn)化加速了蛋白質(zhì)的自然進(jìn)化過(guò)程,為蛋白質(zhì)科學(xué)和應(yīng)用創(chuàng)造了無(wú)限機(jī)會(huì)。該方法的最初貢獻(xiàn)者Frances H. Arnold獲得了2018年的諾貝爾化學(xué)獎(jiǎng)。近年來(lái),人們致力于構(gòu)建更有效的定向進(jìn)化方法,這不僅有助于深入理解蛋白質(zhì)的基礎(chǔ)科學(xué),還可以創(chuàng)造優(yōu)于自然或不存在的酶和抗體,并促進(jìn)合成生物學(xué)的應(yīng)用。
6.1.基于結(jié)構(gòu)的進(jìn)化
一種基于對(duì)蛋白質(zhì)結(jié)構(gòu)-功能關(guān)系的深刻理解的策略,稱為合理設(shè)計(jì),可以在短時(shí)間內(nèi)產(chǎn)生所需的突變體。精確定義突變“熱點(diǎn)”是實(shí)現(xiàn)期望結(jié)果的關(guān)鍵。此外,構(gòu)建更小但更智能的突變庫(kù)可以顯著加快進(jìn)化過(guò)程。
隨著生物信息學(xué)的快速發(fā)展,“熱點(diǎn)”預(yù)測(cè)變得流行,因?yàn)槟承埢恢蒙系耐蛔兿拗频尼尫趴赡軐?duì)酶的特定功能產(chǎn)生重大影響。已經(jīng)開(kāi)發(fā)出計(jì)算工具來(lái)識(shí)別和評(píng)估有利的熱點(diǎn)。例如,ConSurf網(wǎng)絡(luò)服務(wù)器可以分析蛋白質(zhì)結(jié)構(gòu)的進(jìn)化保守模式,LigPlot+程序可以生成蛋白質(zhì)-配體相互作用的示意圖,CAVER 3.0可以可視化隧道和通道中的蛋白質(zhì)結(jié)構(gòu)。PoPMuSiC網(wǎng)絡(luò)服務(wù)器可以估計(jì)最近的蛋白質(zhì)穩(wěn)定性變化,算法ASRA和Innov’SAR非常適合作為在結(jié)合口袋內(nèi)飽和突變的指導(dǎo),以增強(qiáng)立體選擇性和活性。
隨后開(kāi)發(fā)了各種專注于活性位點(diǎn)工程的穩(wěn)健策略,并已用于脂肪酶、葡聚糖酶、木聚糖酶和其他酶進(jìn)化的主要成就。通過(guò)結(jié)構(gòu)和系統(tǒng)發(fā)育分析,環(huán)重塑在幾個(gè)突變步驟內(nèi)重新構(gòu)建了具有PTE樣乳糖活性的磷酸三酯酶(PTE),展示了環(huán)重塑在快速區(qū)分新酶功能方面的潛在作用。逐步環(huán)插入策略(StLois)通過(guò)結(jié)構(gòu)和功能分析相應(yīng)的酶,有效地?cái)U(kuò)展了環(huán)區(qū)域的殘基,為新催化屬性提供了新的酶活性位點(diǎn)結(jié)構(gòu)。結(jié)構(gòu)域交換有助于揭示重要調(diào)節(jié)器的結(jié)構(gòu)和功能信息,例如β抑制因子和衰減加速器。
半合理設(shè)計(jì)在選定的殘基上引入隨機(jī)突變,飽和突變?cè)谶x定的殘基上創(chuàng)建了一個(gè)包含所有可能突變的小突變體庫(kù),其中一些可能對(duì)突變蛋白有益。值得注意的是,在密碼子簡(jiǎn)并性的幫助下,組合活性位點(diǎn)飽和測(cè)定(CAST)和迭代飽和突變(ISM)的有效構(gòu)建。在創(chuàng)建“智能庫(kù)”方面取得了顯著進(jìn)展。這些方法已被報(bào)道成功改善了酶的性質(zhì),如熱穩(wěn)定性、催化活性和對(duì)映體選擇性。酶工程與系統(tǒng)代謝工程的結(jié)合也顯著增加了目標(biāo)產(chǎn)物的代謝通量。
6.2.隨機(jī)突變
定向進(jìn)化不依賴于酶的結(jié)構(gòu)信息,而依賴于酶的序列信息,為實(shí)驗(yàn)室在幾個(gè)月內(nèi)而不是數(shù)百萬(wàn)年獲得所需的突變體提供了有希望的方法。變異的序列空間非常大,例如,在四個(gè)殘基上突變可能會(huì)產(chǎn)生160,000(20^4)個(gè)序列。定向進(jìn)化中的一個(gè)關(guān)鍵問(wèn)題是如何有效地生成突變體庫(kù)。通用方法是錯(cuò)誤傾向PCR(epPCR),它引入了基因的變化。研究人員通過(guò)改變PCR反應(yīng)條件顯著增加了突變率。Zaccolo等人通過(guò)改變PCR條件和突變PCR循環(huán)次數(shù),將突變率重新調(diào)整為每五個(gè)堿基對(duì)一個(gè)突變。到目前為止,epPCR已經(jīng)取得了許多成功,例如提高酶和底物的活性、親和力和穩(wěn)定性。最重要的是,epPCR也是通過(guò)分析大規(guī)模序列多樣性來(lái)研究分子進(jìn)化的強(qiáng)大方法。
DNA重組模仿自然同源重組,這是自然進(jìn)化的另一種機(jī)制。在DNA重組期間,兩個(gè)或多個(gè)相關(guān)的起始基因被重組,產(chǎn)生具有新組合的隨機(jī)序列的變異基因池。與epPCR相比,DNA重組結(jié)合了相關(guān)功能蛋白的片段,產(chǎn)生新序列,這些序列與所需的蛋白結(jié)構(gòu)和功能兼容的可能性相對(duì)較高。一個(gè)例子是從過(guò)氧化氫酶生成具有改變的選擇性的活性鹵素酶變體,以擴(kuò)大未激活的C-H鍵的酶促鹵化能力。同樣,基于BRC重復(fù)模塊性的基序重組被用來(lái)生成更強(qiáng)的嵌合體,與RAD51結(jié)合。
最近,已經(jīng)開(kāi)發(fā)了許多有前景的技術(shù)用于體內(nèi)蛋白質(zhì)進(jìn)化(圖5)。這些方法通過(guò)將突變酶或核酸酶定位到DNA中,直接在宿主生物體內(nèi)生成多個(gè)隨機(jī)突變。CRISPR/Cas9開(kāi)創(chuàng)了基因組編輯的新時(shí)代,也已應(yīng)用于蛋白質(zhì)工程。EvolvR系統(tǒng)由Cas9-nickase和連續(xù)在gRNAs的指導(dǎo)下產(chǎn)生可調(diào)窗口中突變的錯(cuò)誤傾向DNAP I組成。更具體地說(shuō),一種新的體內(nèi)突變方法,CRISPR-Enabled Traceable Genome Engineering(CREATE),利用CRISPR/Cas9系統(tǒng)和條形碼跟蹤盒突變多個(gè)位點(diǎn)并跟蹤它們。它可以為整個(gè)蛋白質(zhì)序列形成單堿基庫(kù),構(gòu)建一個(gè)飽和庫(kù),其中每個(gè)氨基酸殘基都被替換。噬菌體輔助順序進(jìn)化(PACE)是另一種體內(nèi)進(jìn)化策略。它利用M13噬菌體在大腸桿菌中突變基因的生存能力。一般來(lái)說(shuō),PACE可以進(jìn)化任何與基本噬菌體基因表達(dá)相關(guān)的蛋白質(zhì)。由于噬菌體生命周期的快速代時(shí)間,一天內(nèi)可以在沒(méi)有人為干預(yù)的情況下進(jìn)行數(shù)十輪進(jìn)化。此外,由于T7 RNA聚合酶對(duì)DNA的結(jié)合親和力,它被用于幾個(gè)體內(nèi)蛋白質(zhì)進(jìn)化系統(tǒng)中。MutaT7是一種包含T7 RNA聚合酶和胞嘧啶脫氨酶的嵌合蛋白,可以編輯或突變T7啟動(dòng)子下游的特定基因。最近,基于T7 RNA聚合酶的定向體內(nèi)多樣化(TRIDENT)已經(jīng)開(kāi)發(fā)出來(lái),它基于T7 RNA聚合酶的進(jìn)化平臺(tái),利用增加的突變多樣性和更高的體內(nèi)突變率。

圖5 正在興起的體內(nèi)突變方法概覽。A, PACE的原理圖。PACE利用M13噬菌體的存活來(lái)在大腸桿菌中突變基因。MP,誘變質(zhì)粒;AP,輔助質(zhì)粒;SP,選擇質(zhì)粒。B, EvolvR的原理圖。EvolvR利用一個(gè)由錯(cuò)誤傾向的Pol I和Cas9的切口變異體組成的嵌合蛋白,通過(guò)gRNA靶向特異性突變基因。nCas9,Cas9的切口變異體。C, CREATE的原理圖。CREATE利用帶有條形碼追蹤突變的CRISPR-Cas9進(jìn)行多重基因組工程。
6.3.高通量篩選
高通量篩選是一種從大型變體庫(kù)中獲得所需突變體的技術(shù)?;谖⒖装宓暮Y選方法是酶定向進(jìn)化中最常用的方法。這些系統(tǒng)具有易于安裝、操作方便和強(qiáng)大的多功能性的優(yōu)點(diǎn)。然而,篩選能力相對(duì)較低,通常限于每天103-104個(gè)菌落。為了加快篩選速度,已經(jīng)開(kāi)發(fā)了自動(dòng)化設(shè)備,如機(jī)器人液體處理單元和菌落挑選系統(tǒng)。在高通量篩選方法中,通常使用比色或熒光底物來(lái)測(cè)量酶活性。這種篩選還可以與pH指示劑或產(chǎn)生吸收或熒光信號(hào)的酶級(jí)聯(lián)反應(yīng)結(jié)合,以創(chuàng)建高通量篩選方法。
生長(zhǎng)互補(bǔ)選擇是一種強(qiáng)大的篩選方法,每當(dāng)目標(biāo)酶對(duì)宿主細(xì)胞生存至關(guān)重要時(shí)。這種方法已廣泛應(yīng)用于與主要代謝途徑相關(guān)的酶,包括tRNA合成酶、蛋白酶、氨基酸合成異構(gòu)酶等。同樣,可以通過(guò)拯救含有關(guān)鍵位置點(diǎn)突變的缺陷抗生素抗性基因來(lái)篩選具有所需功能的酶,例如堿基編輯器。
熒光激活細(xì)胞分選(FACS)和熒光激活液滴分選(FADS)具有大于10^6個(gè)/小時(shí)的篩選通量,使它們成為超高通量篩選技術(shù)基準(zhǔn)。在開(kāi)創(chuàng)性研究中,為糖基轉(zhuǎn)移酶設(shè)計(jì)了可以在細(xì)胞內(nèi)外自由移動(dòng)的熒光底物,熒光產(chǎn)物可以在細(xì)胞內(nèi)捕獲并通過(guò)流式細(xì)胞儀篩選。對(duì)于不能吸收所需底物或保留熒光信號(hào)的細(xì)胞,F(xiàn)ADS使用液滴作為酶微反應(yīng)器來(lái)分離單個(gè)細(xì)胞。微流控芯片系統(tǒng)允許進(jìn)行多種操作,如液滴產(chǎn)生、細(xì)胞裂解、試劑添加、孵育、熒光檢測(cè)和雙通道篩選。最近,發(fā)明了一種結(jié)合FACS和FADS的方法,其中可以使用商業(yè)FACS儀器選擇完整的雙乳液滴。
蛋白質(zhì)展示技術(shù)是篩選蛋白質(zhì)或肽結(jié)合活性的重要平臺(tái)。噬菌體表面展示首次用于研究抗原-抗體結(jié)合。隨后發(fā)明了各種細(xì)胞展示方法,如細(xì)菌展示和酵母表面展示。細(xì)胞展示方法也廣泛用于定向進(jìn)化,如提高β-內(nèi)酰胺酶的穩(wěn)定性和擴(kuò)大DNA聚合酶的底物譜。同樣,無(wú)細(xì)胞展示方法,如核糖體展示和mRNA展示,加速了酶的定向進(jìn)化。
與噬菌體展示相比,細(xì)胞表面展示提供了更大的展示表面,并且如果相關(guān)熒光檢測(cè)可用,也可以通過(guò)FACS/FADS進(jìn)行篩選。此外,無(wú)細(xì)胞展示系統(tǒng)克服了基于細(xì)胞的展示方法對(duì)轉(zhuǎn)化效率的限制,因?yàn)樗梢蕴幚砀哌_(dá)10^14個(gè)成員的庫(kù),并且也適用于生成有毒或不穩(wěn)定的蛋白質(zhì)。
7.計(jì)算機(jī)輔助設(shè)計(jì)功能蛋白
蛋白質(zhì)是具有豐富生物功能的細(xì)胞大分子,構(gòu)成生物系統(tǒng)的基本構(gòu)建塊。然而,由于蛋白質(zhì)系統(tǒng)的序列結(jié)構(gòu)-功能空間相當(dāng)大,數(shù)學(xué)解決蛋白質(zhì)相關(guān)問(wèn)題極其具有挑戰(zhàn)性。蛋白質(zhì)的有效設(shè)計(jì),合成生物學(xué)的核心任務(wù)之一,以可接受的準(zhǔn)確性為代價(jià)顯著壓縮了搜索空間。計(jì)算蛋白質(zhì)設(shè)計(jì)的目標(biāo)是使用算法創(chuàng)建能夠折疊成特定結(jié)構(gòu)并具有所需功能的蛋白質(zhì)。隨著蛋白質(zhì)結(jié)構(gòu)計(jì)算預(yù)測(cè)的突破和序列設(shè)計(jì)算法的不斷出現(xiàn),已經(jīng)有可能開(kāi)發(fā)支持合成生物學(xué)的計(jì)算蛋白質(zhì)設(shè)計(jì)平臺(tái)。
7.1.設(shè)計(jì)蛋白質(zhì)結(jié)構(gòu)的算法
目前,蛋白質(zhì)序列通常根據(jù)現(xiàn)有蛋白質(zhì)結(jié)構(gòu)的數(shù)據(jù),按照固定的主鏈進(jìn)行設(shè)計(jì)。與給定的狹窄結(jié)構(gòu)空間相比,相應(yīng)的蛋白質(zhì)序列空間相當(dāng)大,表型負(fù)影響可以顯著削弱設(shè)計(jì)蛋白質(zhì)的可折疊性。因此,序列設(shè)計(jì)需要開(kāi)發(fā)針對(duì)性的算法和策略。計(jì)算蛋白質(zhì)設(shè)計(jì)常用的方法可分為以下幾類。(i)主鏈生成:根據(jù)序列設(shè)計(jì)的要求構(gòu)建主鏈構(gòu)象模型。(ii)側(cè)鏈布局:根據(jù)給定的蛋白質(zhì)框架結(jié)構(gòu),選擇一組合適的氨基酸側(cè)鏈構(gòu)象以滿足主鏈結(jié)構(gòu)的要求。這需要實(shí)際設(shè)計(jì)序列,也稱為蛋白質(zhì)序列設(shè)計(jì)。(iii)剛體放置:固定蛋白質(zhì)/蛋白質(zhì)或蛋白質(zhì)/小分子之間的相對(duì)空間位置和方向。(iv)負(fù)膜設(shè)計(jì):增加非目標(biāo)狀態(tài)的能量并實(shí)現(xiàn)有效折疊,可以視為側(cè)鏈布局算法的優(yōu)化和補(bǔ)充。
計(jì)算蛋白質(zhì)設(shè)計(jì)通常涉及三個(gè)步驟。首先,在主鏈上放置離散的側(cè)鏈構(gòu)象。接下來(lái),計(jì)算插入的側(cè)鏈與原始側(cè)鏈之間的能量以及側(cè)鏈與主鏈之間的能量。最后,通過(guò)搜索算法優(yōu)化序列和構(gòu)象的組合(圖6)。整個(gè)過(guò)程涉及通過(guò)搜索算法優(yōu)化一系列序列組合及其相應(yīng)的結(jié)構(gòu)。預(yù)先給出固定的主鏈框架(例如,派生于天然蛋白質(zhì)結(jié)構(gòu))。每個(gè)主鏈位置上的氨基酸殘基類型及其側(cè)鏈構(gòu)象未知,應(yīng)進(jìn)行計(jì)算。不同位置的殘基選擇和結(jié)構(gòu)狀態(tài)的可能組合構(gòu)成氨基酸序列和側(cè)鏈結(jié)構(gòu)空間。在此空間中定義的能量函數(shù)用于評(píng)估特定的序列和構(gòu)象組合。搜索算法自動(dòng)搜索未知數(shù)量的序列空間和側(cè)鏈構(gòu)象,以找到設(shè)計(jì)蛋白質(zhì)結(jié)構(gòu)的最低能量解決方案。為了正確模擬突變的側(cè)鏈構(gòu)象,需要重新設(shè)計(jì)現(xiàn)有結(jié)構(gòu)。這一步通常使用軟件的依賴于主鏈的轉(zhuǎn)子分子庫(kù)執(zhí)行,而側(cè)鏈的優(yōu)化是能量依賴的。

圖6 計(jì)算機(jī)輔助蛋白質(zhì)設(shè)計(jì)的原理和實(shí)例。
能量函數(shù)是表征每個(gè)序列組合不同構(gòu)象結(jié)構(gòu)的基礎(chǔ)。不同的算法使用不同的能量函數(shù),主要包括物理能量項(xiàng)(非共價(jià)范德華相互作用、靜電能量、氫鍵能量、溶解自由能)和統(tǒng)計(jì)能量項(xiàng)(主鏈二面角、側(cè)鏈扭轉(zhuǎn))。最廣泛使用的能量函數(shù)是Rosetta能量函數(shù)(主要由物理能量項(xiàng)決定)和基于主鏈的氨基酸使用調(diào)查(ABACUS)/側(cè)鏈未知主鏈排列(SCUBA)能量函數(shù)(主要由統(tǒng)計(jì)能量項(xiàng)決定)。
在固定主鏈的蛋白質(zhì)設(shè)計(jì)中,共價(jià)鍵的長(zhǎng)度和角度通常是恒定的,需要考慮的主要相互作用是非共價(jià)的。在Rosetta能量函數(shù)中,使用Lennard-Jones勢(shì)計(jì)算范德華相互作用能量。靜電能量是使用CHARMM分子力場(chǎng)的原始原子電荷分布計(jì)算的,并通過(guò)團(tuán)體優(yōu)化進(jìn)行調(diào)整。氫鍵能量是使用靜電模型和特殊的氫鍵模型計(jì)算的,氫鍵被分類為四種類型:長(zhǎng)程主鏈氫鍵、短程主鏈氫鍵和主鏈與側(cè)鏈原子之間的氫鍵。側(cè)鏈之間的氫鍵是單獨(dú)計(jì)算的。Lazaridis-Karplus隱式高斯排斥模型可以包含各向同性和各向異性的溶解自由能,以描述溶解效應(yīng)。統(tǒng)計(jì)能量項(xiàng)代表通過(guò)將數(shù)據(jù)庫(kù)中存在的概率分布轉(zhuǎn)換獲得的能量。從統(tǒng)計(jì)熱力學(xué)的角度來(lái)看,在平衡狀態(tài)下,系統(tǒng)不同微觀狀態(tài)的能量和概率遵循玻爾茲曼分布。
另一種觀點(diǎn)是,從純粹的統(tǒng)計(jì)角度來(lái)看,假設(shè)給定主鏈結(jié)構(gòu)的氨基酸序列分布可以寫成條件概率,序列設(shè)計(jì)要解決的問(wèn)題是找到具有最大條件概率的序列。因此,ABACUS結(jié)合了不同的結(jié)構(gòu)特征:氨基酸位置的結(jié)構(gòu)類型;主鏈二面角;溶劑可及性;相對(duì)位置;以及殘基之間的統(tǒng)計(jì)信息,以獲得側(cè)鏈轉(zhuǎn)子(轉(zhuǎn)子是旋量異構(gòu)體)和原子包裝能量。此外,SCUBA利用神經(jīng)網(wǎng)絡(luò)從以主鏈為中心的結(jié)構(gòu)變量能量景觀中學(xué)習(xí)顯式能量項(xiàng)。SCUBA和ABACUS一起,為人工蛋白質(zhì)的設(shè)計(jì)提供了全面的解決方案。
搜索算法對(duì)于蛋白質(zhì)序列設(shè)計(jì)也至關(guān)重要,以避免在相當(dāng)大的序列空間中遍歷所有構(gòu)象組合,甚至是更大的構(gòu)象空間。因此,作為一種隨機(jī)軟件,Rosetta基于蒙特卡洛方法設(shè)計(jì),以執(zhí)行多次模擬生成的構(gòu)象的統(tǒng)計(jì)分析,然后獲得數(shù)值解。Rosetta首先使用隨機(jī)數(shù)生成器生成隨機(jī)圖像。然后確認(rèn)隨機(jī)擾動(dòng),并評(píng)分新構(gòu)象,接受所有評(píng)分更高的構(gòu)象和以一定概率評(píng)分較低的構(gòu)象,直到在給定的周期內(nèi)選擇最佳評(píng)分。然而,這種迭代算法通常陷入局部最小值。為了獲得全局能量最小構(gòu)象,除了分子動(dòng)力學(xué)模擬,還使用了物理概念的動(dòng)量。想象一個(gè)小球從高能函數(shù)滾下來(lái)。當(dāng)動(dòng)量足夠高時(shí),球不會(huì)被困在小坑里,而是會(huì)沖向最后的峽谷。迭代不僅考慮當(dāng)前能量,還考慮之前的能量變化。
基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)提出了幾種算法。受到結(jié)構(gòu)預(yù)測(cè)算法trRosetta成功的啟發(fā),Baker等人進(jìn)一步開(kāi)發(fā)了Hallucination蛋白質(zhì)從頭設(shè)計(jì)方法。首先,將隨機(jī)序列輸入trRosetta作為輸入,以預(yù)測(cè)殘基接觸圖。然后,使用蒙特卡洛方法對(duì)氨基酸序列空間進(jìn)行采樣,并計(jì)算序列之間的KL散度,以獲得可折疊的序列和預(yù)測(cè)結(jié)構(gòu)。Hallucination方法提出了基于卷積神經(jīng)網(wǎng)絡(luò)的DeepDream算法,該算法將輸入轉(zhuǎn)換為訓(xùn)練數(shù)據(jù)空間,并產(chǎn)生(注意時(shí)態(tài))類似夢(mèng)境的幻覺(jué)。因此,Hallucination方法可以用來(lái)快速設(shè)計(jì)與輸入序列相似并符合trRosetta學(xué)習(xí)到的序列結(jié)構(gòu)關(guān)系的蛋白質(zhì)序列,但與自然序列大相徑庭。
7.2.合成生物學(xué)中的蛋白質(zhì)設(shè)計(jì)
從蛋白質(zhì)結(jié)構(gòu)設(shè)計(jì)的序列無(wú)法直接滿足合成生物學(xué)對(duì)所需功能蛋白的需求。蛋白質(zhì)的計(jì)算設(shè)計(jì)主要包括蛋白質(zhì)自身骨架的設(shè)計(jì)、蛋白質(zhì)-大分子相互作用和蛋白質(zhì)-小分子相互作用的設(shè)計(jì)。這些相互作用可以被工程化,以優(yōu)化作為合成生物學(xué)組成部分的天然蛋白質(zhì)的功能,同時(shí)創(chuàng)建具有所需功能的生物傳感器、生物催化劑和疫苗。
蛋白質(zhì)框架的設(shè)計(jì)旨在增強(qiáng)天然蛋白質(zhì)的穩(wěn)健性,穩(wěn)定疫苗表位,并在特定條件下修改蛋白質(zhì)穩(wěn)定性。為了開(kāi)發(fā)新型冠狀抑制劑,并基于新型冠狀病毒S蛋白和人類血管緊張素轉(zhuǎn)換酶2(ACE2)的復(fù)合物結(jié)構(gòu),Baker等人使用與S蛋白受體結(jié)合區(qū)結(jié)合的ACE2的螺旋片段作為起點(diǎn)。嘗試通過(guò)添加兩個(gè)額外的螺旋來(lái)穩(wěn)定結(jié)構(gòu)。此外,在微蛋白庫(kù)中使用蛋白質(zhì)分子對(duì)接和蛋白質(zhì)界面設(shè)計(jì),設(shè)計(jì)了能夠在皮摩爾濃度下抑制2019-nCoV的小蛋白。Correia等人開(kāi)發(fā)了TopoBuilder系統(tǒng),用于從頭設(shè)計(jì)能夠穩(wěn)定復(fù)雜預(yù)定義構(gòu)建塊的蛋白質(zhì)。對(duì)于不同的表位,作者列舉了合適的二維蛋白質(zhì)拓?fù)浣Y(jié)構(gòu),并使用理想的二級(jí)結(jié)構(gòu)構(gòu)建了三級(jí)結(jié)構(gòu)模型。這種方法被用來(lái)設(shè)計(jì)同時(shí)呈現(xiàn)三種抗原的蛋白質(zhì)。結(jié)合物理能量項(xiàng)、統(tǒng)計(jì)能量項(xiàng)和生物信息學(xué)分析,吳等人開(kāi)發(fā)了一種基于單點(diǎn)預(yù)測(cè)算法和“貪婪”算法融合的蛋白質(zhì)工程貪婪累積策略(GRAPE策略),通過(guò)計(jì)算重塑PET塑料水解酶,實(shí)現(xiàn)了單點(diǎn)突變,將最終突變的熱熔溫度提高了31°C。
設(shè)計(jì)蛋白質(zhì)-大分子相互作用可以用于合成細(xì)胞中的信號(hào)轉(zhuǎn)導(dǎo)和調(diào)節(jié)。Baker等人計(jì)算設(shè)計(jì)的生物傳感器可以利用信號(hào)傳導(dǎo)途徑中自然發(fā)生的相互作用蛋白。在沒(méi)有檢測(cè)目標(biāo)的情況下,傳感器的lucCage蛋白的鎖定域與籠子域結(jié)合。相比之下,在檢測(cè)目標(biāo)存在的情況下,lucCage域的末端區(qū)域與檢測(cè)目標(biāo)結(jié)合,lucCage蛋白打開(kāi)并與傳感器的lucKey蛋白結(jié)合,激活熒光素酶發(fā)出熒光。同一組還設(shè)計(jì)了邏輯門來(lái)調(diào)節(jié)蛋白質(zhì)結(jié)合,構(gòu)建了從頭設(shè)計(jì)的背骨螺旋框架,并構(gòu)建了氫鍵網(wǎng)絡(luò)以優(yōu)化序列。設(shè)計(jì)了具有特定異二聚體的多個(gè)蛋白質(zhì)對(duì),使用單體或連接單體作為輸入。門控單元通過(guò)為特定結(jié)合設(shè)計(jì)的氫鍵網(wǎng)絡(luò)編碼接受不同的輸入。
蛋白質(zhì)和小分子的相互作用設(shè)計(jì)可以獲得新的酶催化組分、轉(zhuǎn)錄因子和小分子傳感器。通過(guò)設(shè)計(jì)具有底物選擇性的酶,可以為直接用于生物工業(yè)催化以及新途徑設(shè)計(jì)生成新的生化反應(yīng)。在這方面,Kortemme等人篩選了與天然蛋白質(zhì)結(jié)構(gòu)結(jié)合的法尼基焦磷酸(FPP)的四個(gè)殘基結(jié)合模塊。然后他們?cè)O(shè)計(jì)了可以與各種框架界面結(jié)合并進(jìn)一步優(yōu)化的FPP調(diào)控的生物傳感器。Ranganathan等人使用直接耦合分析提取了多重序列比對(duì)(MSA)中隱含序列結(jié)構(gòu)函數(shù)空間的統(tǒng)計(jì)約束。他們?cè)O(shè)計(jì)了一個(gè)與天然酶活性相當(dāng)?shù)拿Р菟徂D(zhuǎn)位酶。吳等人使用固定主鏈設(shè)計(jì),結(jié)合多個(gè)并行短時(shí)動(dòng)力學(xué)模擬來(lái)補(bǔ)償固定主鏈和側(cè)鏈的不均勻采樣。因此,獲得了天冬氨酸酶催化的非天然氨基酸的水合反應(yīng)。
7.3.簡(jiǎn)短總結(jié)
在過(guò)去的十年中,在計(jì)算創(chuàng)建具有定制活性和特異性的功能蛋白方面取得了令人印象深刻的進(jìn)展。算法開(kāi)發(fā)的驚人速度不斷提高了研究人員操縱蛋白質(zhì)結(jié)構(gòu)和功能的能力。展望未來(lái),預(yù)計(jì)有許多關(guān)鍵趨勢(shì)將加速功能蛋白的發(fā)現(xiàn)、設(shè)計(jì)和應(yīng)用。通過(guò)AI預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的計(jì)算方法的進(jìn)步提高了生物分子社區(qū)的信心,隨后的功能設(shè)計(jì)可能在基于模型和基于數(shù)據(jù)的方法的結(jié)合幫助下,為滿足目標(biāo)反應(yīng)的需求提供途徑。隨著蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)和標(biāo)準(zhǔn)實(shí)驗(yàn)數(shù)據(jù)的不斷增長(zhǎng),更先進(jìn)的計(jì)算方法將為解釋潛在的催化機(jī)制創(chuàng)造進(jìn)一步的研究機(jī)會(huì),最終導(dǎo)致對(duì)功能蛋白的結(jié)構(gòu)-功能關(guān)系有更清晰的認(rèn)識(shí)。基于計(jì)算蛋白質(zhì)設(shè)計(jì)的相當(dāng)大的成功,預(yù)計(jì)未來(lái)將見(jiàn)證為合成生物學(xué)生成更有效、定制化的蛋白質(zhì)。
8.細(xì)胞和基因回路工程
無(wú)論是使用傳統(tǒng)的生物工程還是當(dāng)前的合成生物學(xué),設(shè)計(jì)具有有益功能的細(xì)胞都面臨著相當(dāng)?shù)奶魬?zhàn)。在合成生物學(xué)時(shí)代,工程細(xì)胞的一個(gè)標(biāo)志是強(qiáng)調(diào)在系統(tǒng)和定量層面設(shè)計(jì)和重建非自然的細(xì)胞行為,這通常需要多個(gè)組件形成具有特定拓?fù)浣Y(jié)構(gòu)和功能的交互網(wǎng)絡(luò)。這些可設(shè)計(jì)的生物網(wǎng)絡(luò)由大分子組成,如蛋白質(zhì)、DNA、RNA或每個(gè)細(xì)胞內(nèi)的任何遺傳部分,稱為基因回路。值得指出的是,這樣的網(wǎng)絡(luò)可以在邏輯上超越單細(xì)胞層面,換句話說(shuō),通過(guò)直接或間接的細(xì)胞間接觸或通信形成互動(dòng)的多細(xì)胞系統(tǒng),稱為細(xì)胞回路。
工程化細(xì)胞和基因回路面臨兩個(gè)基本挑戰(zhàn):(i) 強(qiáng)調(diào)正交性和模塊性的可用遺傳組件;(ii) 提供可預(yù)測(cè)電路行為的理論指導(dǎo)的電路模塊設(shè)計(jì)原則的知識(shí)。此外,設(shè)計(jì)過(guò)程高度依賴于復(fù)雜的計(jì)算建模能力,以分析和預(yù)測(cè)更大電路和參數(shù)空間中的電路行為。
因此,合成細(xì)胞的計(jì)算輔助設(shè)計(jì)將進(jìn)一步加強(qiáng)自動(dòng)化和人工智能在未來(lái)細(xì)胞工程中的應(yīng)用,我們將在下一節(jié)中討論。
8.1.合成基因回路和定量細(xì)胞行為
基因回路的概念源自電子電路,但由于大量組件的生化或生物物理相互作用以及這些組件之間的非線性連接所產(chǎn)生的巨大復(fù)雜性,與電子電路有實(shí)質(zhì)上的不同。與天然細(xì)胞中的基因回路類似,合成基因回路包括兩種基本類型:(i) 基于蛋白質(zhì)的信號(hào)回路(或蛋白質(zhì)回路);(ii) 轉(zhuǎn)錄基因調(diào)控回路(或遺傳回路)。然而,這兩種類型差異很小,并且協(xié)調(diào)工作以控制細(xì)胞功能。具體來(lái)說(shuō),蛋白質(zhì)回路通過(guò)膜受體蛋白質(zhì)(或傳感器)在更快的時(shí)間尺度(從秒到分鐘)上處理環(huán)境信號(hào),然后將信號(hào)傳遞到下游基因調(diào)控回路,發(fā)生的時(shí)間尺度更長(zhǎng)(從分鐘到小時(shí))。
在過(guò)去幾十年中,對(duì)合成回路的廣泛研究成功構(gòu)建了具有集成功能的遺傳回路,如邏輯門、帶通、振蕩、適應(yīng)和極化。雖然這些研究中的許多仍處于概念驗(yàn)證階段,但這些合成回路的復(fù)雜性和規(guī)模的增加顯著提高了我們?cè)O(shè)計(jì)和構(gòu)建更有效、更精確的復(fù)雜遺傳回路的能力。合成回路的主要發(fā)展方向是充分利用計(jì)算機(jī)輔助設(shè)計(jì)和自動(dòng)化。為此,需要進(jìn)行大量的研究工作,包括充分表征和標(biāo)準(zhǔn)化的遺傳組件、經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的構(gòu)建和模擬硅電路的算法和軟件,以及定制開(kāi)發(fā)的自動(dòng)化實(shí)驗(yàn)設(shè)備。
值得注意的是,由于遺傳操作的困難和各種蛋白質(zhì)或核酸工具的限制,哺乳動(dòng)物細(xì)胞中的電路工程發(fā)展不足。例如,哺乳動(dòng)物電路工程中使用的啟動(dòng)子數(shù)量通常是個(gè)位數(shù)。在現(xiàn)有的啟動(dòng)子工具箱中,目標(biāo)基因的轉(zhuǎn)錄強(qiáng)度難以連續(xù)調(diào)節(jié),這成為電路設(shè)計(jì)中電路參數(shù)條件實(shí)驗(yàn)驗(yàn)證的主要障礙。此外,許多可誘導(dǎo)的哺乳動(dòng)物啟動(dòng)子的基因轉(zhuǎn)錄動(dòng)態(tài)范圍極低,不利于構(gòu)建需要低基礎(chǔ)但高度可誘導(dǎo)的基因轉(zhuǎn)錄的電路。與細(xì)菌細(xì)胞類似,很難預(yù)測(cè)不同哺乳動(dòng)物細(xì)胞系中啟動(dòng)子強(qiáng)度和誘導(dǎo)的一致性。
蛋白質(zhì)工程比啟動(dòng)子工程更具挑戰(zhàn)性。蛋白質(zhì)功能由20種氨基酸組成的三維結(jié)構(gòu)決定,這比由4種核酸組成的一維序列要復(fù)雜得多。至于傳感器,受體工程已成為建立正交細(xì)胞間信號(hào)傳導(dǎo)的重要領(lǐng)域,其結(jié)果是感應(yīng)給定的細(xì)胞外信號(hào),如合成細(xì)胞因子和生長(zhǎng)因子,或?qū)⒓?xì)胞重定向到特定疾病信號(hào)。嵌合抗原受體(CAR)激活的T細(xì)胞已成為抗癌治療的重要例子。哺乳動(dòng)物細(xì)胞中存在許多類型的蛋白質(zhì),它們?cè)诓煌缴辖⑿盘?hào)通路,包括蛋白激酶/磷酸酶、蛋白酶、適配器/支架蛋白、轉(zhuǎn)錄因子或表觀遺傳調(diào)控蛋白。從病毒中采用的幾種蛋白酶工具已被重新用于控制細(xì)胞功能的許多水平。最近的研究還表明,基于這些工程蛋白酶的復(fù)雜邏輯功能的蛋白質(zhì)回路構(gòu)建主要基于這些工程蛋白酶。最后,從頭開(kāi)始的蛋白質(zhì)設(shè)計(jì)正變得越來(lái)越強(qiáng)大,特別是作為工程化可編程蛋白質(zhì)-蛋白質(zhì)相互作用的工具。值得注意的是,AI算法的最近發(fā)展在未來(lái)蛋白質(zhì)工程中將發(fā)揮重要作用。毫無(wú)疑問(wèn),蛋白質(zhì)工具的發(fā)展對(duì)哺乳動(dòng)物合成生物學(xué)來(lái)說(shuō)是一個(gè)困難但必不可少的任務(wù)。
哺乳動(dòng)物合成生物學(xué)面臨的另一個(gè)挑戰(zhàn)是自然進(jìn)化的“黑箱”所控制的復(fù)雜行為。這些復(fù)雜行為表現(xiàn)出定量特性,其原理仍然不清楚。這些原則幾乎支配著所有重要的細(xì)胞過(guò)程,包括細(xì)胞周期、大小和數(shù)量的控制、穩(wěn)健性和異質(zhì)性、穩(wěn)態(tài)和生長(zhǎng)、細(xì)胞分化和死亡等。迄今為止,很少有合成生物學(xué)研究能夠涵蓋這些生命之謎。令人鼓舞的是,合成生物學(xué)的自下而上方法已經(jīng)顯示出新途徑,以比以往認(rèn)為的更詳細(xì)地理解復(fù)雜生物系統(tǒng)的構(gòu)建。一個(gè)顯著的例子是控制許多基本生物過(guò)程(例如,細(xì)胞周期、晝夜節(jié)律、信號(hào)響應(yīng)、節(jié)肢動(dòng)物發(fā)生)的振蕩回路。作為下一步,這個(gè)振蕩回路預(yù)計(jì)將作為一個(gè)“中央處理器”,智能控制工程細(xì)胞的功能。
我們預(yù)計(jì),哺乳動(dòng)物細(xì)胞工程,連同新的工具和技術(shù),將是合成生物學(xué)的下一個(gè)關(guān)鍵步驟之一。
8.2.基于細(xì)胞間通信的細(xì)胞回路
哺乳動(dòng)物合成生物學(xué)的一個(gè)新興領(lǐng)域是工程化多細(xì)胞系統(tǒng)。這將形成基于細(xì)胞間通信的具有特定電路結(jié)構(gòu)和功能的相互作用。對(duì)于細(xì)菌細(xì)胞來(lái)說(shuō),一個(gè)明確的方向是從多樣化的自然環(huán)境和與疾病相關(guān)的腸道到農(nóng)業(yè)重要土壤中重建微生物群落。至于哺乳動(dòng)物細(xì)胞,它們自然存在于多細(xì)胞相互作用的背景下,即使在結(jié)構(gòu)良好的器官中也是如此。因此,多細(xì)胞水平的細(xì)胞工程代表了合成生物學(xué)的另一個(gè)主要途徑。
自然系統(tǒng)中的細(xì)胞間通信以三種方式發(fā)生:(i) 發(fā)送細(xì)胞產(chǎn)生并分泌的蛋白質(zhì)或小分子擴(kuò)散,并在接收細(xì)胞中激活表面受體蛋白或細(xì)胞內(nèi)傳感器;(ii) 信號(hào)分子(通常是小的第二信使分子)通過(guò)通道蛋白傳輸?shù)街苯咏佑|的鄰近接收細(xì)胞;(iii) 發(fā)送細(xì)胞上的膜配體和接收細(xì)胞上的膜受體之間的直接相互作用。很可能發(fā)送細(xì)胞的信號(hào)觸發(fā)接收細(xì)胞中的轉(zhuǎn)錄事件。無(wú)論如何,這些細(xì)胞級(jí)電路將導(dǎo)致在單細(xì)胞層面上不會(huì)發(fā)生的極其復(fù)雜的群體行為。細(xì)菌和哺乳動(dòng)物細(xì)胞中的空間組織模式可以通過(guò)典型的帶通電路或邏輯門形成。最近,合成群體感應(yīng)電路已成功部署以控制細(xì)菌和哺乳動(dòng)物細(xì)胞中的細(xì)胞群體大小。
然而,這種細(xì)胞電路仍處于早期發(fā)展階段。未來(lái)需要克服兩大挑戰(zhàn)。首先,目前研究中使用的信號(hào)分子太少。相比之下,人體內(nèi)存在數(shù)百種細(xì)胞因子和生長(zhǎng)因子,它們參與了大量細(xì)胞類型的多重調(diào)節(jié)。因此,工程化合成細(xì)胞因子或其他因素以構(gòu)建未來(lái)的細(xì)胞電路是很有吸引力的。其次,設(shè)計(jì)用于直接接觸通信的正交受體和配體對(duì)是困難的。最成功的示例是合成Notch(synNotch)信號(hào),它通過(guò)細(xì)胞外識(shí)別域使任何配體結(jié)合,并觸發(fā)可編程的下游基因轉(zhuǎn)錄。幾項(xiàng)示范性研究已經(jīng)將synNotch系統(tǒng)應(yīng)用于空間有序的多細(xì)胞結(jié)構(gòu)。
除了與基因電路類似的技術(shù)挑戰(zhàn)外,結(jié)構(gòu)如何決定電路功能的基本原理難以理解,特別是考慮到細(xì)胞群體時(shí)空調(diào)節(jié)的復(fù)雜性不斷增加。例如,設(shè)計(jì)具有精確控制的生物穩(wěn)定性或多穩(wěn)定性的電路對(duì)于合成細(xì)胞分化有多大意義?哪些電路拓?fù)浣Y(jié)構(gòu)能夠在治療疾病時(shí)實(shí)現(xiàn)高效信號(hào)放大,具有高保真度和穩(wěn)健性?細(xì)胞電路如何控制穩(wěn)態(tài)下的細(xì)胞群體大小和類型?我們預(yù)計(jì)這些問(wèn)題需要在細(xì)胞電路層面對(duì)基本設(shè)計(jì)原則進(jìn)行定量和全面的考慮。

圖7 用于治療的合成細(xì)胞和基因回路。在單細(xì)胞水平上,工程努力將集中在三個(gè)主要方面:(i) 能夠識(shí)別疾病或環(huán)境信號(hào)作為生化反應(yīng)的傳感器;然后(ii) 基因回路作為“中央處理器”來(lái)處理各種輸入信號(hào),產(chǎn)生(iii) 定量定義的輸出功能以控制細(xì)胞功能。在多細(xì)胞水平上,合成細(xì)胞因子分泌或直接配體-受體相互作用實(shí)現(xiàn)了各種細(xì)胞間通信,形成拓?fù)溆行虻募?xì)胞回路或空間有序的類器官模式。這些單個(gè)或多個(gè)工程化活細(xì)胞可能作為強(qiáng)大的藥物平臺(tái),用于治療復(fù)雜疾病,如癌癥和代謝性疾病。
8.3.工程化活細(xì)胞治療
細(xì)胞和遺傳電路工程的另一個(gè)主要趨勢(shì)是將目前“玩具”系統(tǒng)中的概念驗(yàn)證擴(kuò)展到與疾病相關(guān)的臨床應(yīng)用。與傳統(tǒng)的分子藥物形式相比,活細(xì)胞藥物作為部署有效載荷藥物或執(zhí)行復(fù)雜功能的集成平臺(tái)具有顯著優(yōu)勢(shì)(例如,細(xì)胞溶解、傷口愈合),這些功能可以由集成的基因或細(xì)胞電路智能控制。通過(guò)這樣做,細(xì)胞藥物可以在最小化副作用的同時(shí)顯著提高抗病效果。例如,重新配置的細(xì)胞因子信號(hào)通路可以作為細(xì)胞因子開(kāi)關(guān),感應(yīng)并消除促腫瘤細(xì)胞因子,創(chuàng)造一個(gè)促免疫細(xì)胞因子的微環(huán)境。在CAR-T細(xì)胞中,部署具有邏輯門或超敏功能的蛋白質(zhì)電路,以產(chǎn)生對(duì)腫瘤抗原的更特異性識(shí)別。CAR-T免疫療法已經(jīng)展示了活細(xì)胞作為一種藥物形式的力量,即細(xì)胞療法。在另一個(gè)案例中,通過(guò)光遺傳學(xué)控制的基因電路通過(guò)閉環(huán)控制策略成功地在動(dòng)物血液中智能控制了穩(wěn)態(tài)血糖水平。這些引人注目的例子表明,合成活細(xì)胞藥物已經(jīng)在治療難治性疾病方面迎來(lái)了新的革命。
由于對(duì)人類健康的重要性,目前基于免疫細(xì)胞,特別是T細(xì)胞的治療成功主要依賴于使用免疫細(xì)胞作為治療性底盤細(xì)胞。最近,其他免疫細(xì)胞,如自然殺傷細(xì)胞、巨噬細(xì)胞,不僅在癌癥治療中,也在治療傳染病方面顯示出相當(dāng)?shù)臐摿?。雖然許多作為藥物工程化的細(xì)胞仍處于概念驗(yàn)證階段,我們預(yù)計(jì)一旦我們能夠設(shè)計(jì)出更精確和功能性的基因和細(xì)胞電路,工程化在原代細(xì)胞層面將變得更加容易。一些最近的研究在臨床層面上已經(jīng)顯示出了實(shí)質(zhì)性的改進(jìn)。值得注意的是,多細(xì)胞系統(tǒng)將為細(xì)胞治療提供額外的優(yōu)勢(shì),通過(guò)將功能性電路模塊分配到不同的亞細(xì)胞類型中,可以顯著降低工程成本。一組具有良好編程的相互作用電路的細(xì)胞將作為一個(gè)整體工作,實(shí)現(xiàn)更有效、更安全、成本更低的治療功能。
9.無(wú)細(xì)胞合成生物學(xué)
無(wú)細(xì)胞合成系統(tǒng)代表了與細(xì)胞工程平行的合成生物學(xué)的另一種技術(shù)途徑。無(wú)細(xì)胞合成生物學(xué)的目標(biāo)是一個(gè)沒(méi)有細(xì)胞結(jié)構(gòu)的開(kāi)放系統(tǒng),專注于所需的代謝網(wǎng)絡(luò),使用相應(yīng)的活性成分,如酶和輔酶,來(lái)補(bǔ)充復(fù)雜的生化反應(yīng)。無(wú)細(xì)胞合成生物學(xué)起源于Eduard Buchner關(guān)于“非生命酵母裂解物的無(wú)細(xì)胞乙醇發(fā)酵”的范式轉(zhuǎn)變發(fā)現(xiàn)。另一個(gè)里程碑是Nirenberg和Matthaei對(duì)遺傳密碼及其在蛋白質(zhì)合成中的功能的發(fā)現(xiàn)。對(duì)于無(wú)細(xì)胞合成生物學(xué)的發(fā)展,已經(jīng)提出了兩種類型的無(wú)細(xì)胞系統(tǒng):基于細(xì)胞提取物的系統(tǒng)和基于純化酶的系統(tǒng)?;诩?xì)胞提取物的系統(tǒng)一直用于無(wú)細(xì)胞蛋白質(zhì)合成(CFPS),以實(shí)現(xiàn)細(xì)胞外中心法則的基本過(guò)程(DNA到RNA,RNA到蛋白質(zhì))?;诩兓傅南到y(tǒng)由許多純化或部分純化的酶組成,以實(shí)現(xiàn)復(fù)雜的級(jí)聯(lián)酶反應(yīng),主要用于生物制造功能性生物分子和生化產(chǎn)品。與在細(xì)胞內(nèi)進(jìn)行的系統(tǒng)相比,無(wú)細(xì)胞合成生物系統(tǒng)具有許多優(yōu)點(diǎn),如高產(chǎn)品產(chǎn)量、快速反應(yīng)速率、高工程靈活性、加速的設(shè)計(jì)構(gòu)建測(cè)試學(xué)習(xí)周期、對(duì)有毒環(huán)境的高耐受性以及易于放大。這些特性使無(wú)細(xì)胞合成生物學(xué)成為許多應(yīng)用的重要使能技術(shù)。
9.1.無(wú)細(xì)胞生物系統(tǒng)用于蛋白質(zhì)合成和應(yīng)用
無(wú)細(xì)胞生物系統(tǒng)用于蛋白質(zhì)合成由粗細(xì)胞提取物、DNA模板、ATP再生系統(tǒng)、氨基酸、核苷酸、輔因子和緩沖液組成。可以根據(jù)要求選擇來(lái)自大腸桿菌、釀酒酵母、小麥胚芽、兔網(wǎng)織紅細(xì)胞、昆蟲細(xì)胞和中國(guó)倉(cāng)鼠卵巢細(xì)胞的幾種細(xì)胞提取物。該系統(tǒng)可用于合成毒性或膜蛋白、生物功能原型設(shè)計(jì)、蛋白質(zhì)修飾和生物傳感器。
在體內(nèi)高產(chǎn)量表達(dá)毒性蛋白很困難,因?yàn)槎拘缘鞍卓赡軙?huì)干擾細(xì)胞代謝途徑,而膜蛋白總是以包涵體的形式表達(dá)。無(wú)細(xì)胞生物系統(tǒng)可用于合成限制性內(nèi)切酶、細(xì)胞裂解擴(kuò)張毒素和人類微管結(jié)合蛋白等毒性蛋白,因?yàn)轶w外系統(tǒng)對(duì)有毒環(huán)境具有耐受性。通過(guò)添加表面活性劑、脂質(zhì)體或納米光盤,可以在無(wú)細(xì)胞生物系統(tǒng)中表達(dá)膜蛋白。許多膜蛋白,如G蛋白偶聯(lián)受體、四環(huán)素泵、ATP合酶和丙型肝炎病毒膜蛋白,都是由基于細(xì)胞提取物的無(wú)細(xì)胞生物系統(tǒng)生產(chǎn)的。
對(duì)于生物功能的原型設(shè)計(jì),例如遺傳組件、遺傳電路和代謝途徑,無(wú)細(xì)胞生物系統(tǒng)提供了一個(gè)重要的體外平臺(tái),并允許在細(xì)胞中實(shí)現(xiàn)。對(duì)于單個(gè)遺傳組件(啟動(dòng)子、核糖體結(jié)合位點(diǎn)和終止子),可以通過(guò)PCR突變生成線性表達(dá)模板的變體庫(kù),然后,在微流控技術(shù)的幫助下,可以提取含有單基因變體的細(xì)胞,將其封裝在皮升液滴中。
除了探測(cè)單個(gè)遺傳組件外,無(wú)細(xì)胞生物系統(tǒng)還可以用來(lái)確定這些組件如何在合成基因控制網(wǎng)絡(luò)或“電路”中協(xié)同工作。已經(jīng)組裝并原型設(shè)計(jì)了眾多無(wú)細(xì)胞基因電路,包括由正交聚合酶或σ因子順序表達(dá)驅(qū)動(dòng)的級(jí)聯(lián),以及前饋環(huán)和負(fù)向自我調(diào)節(jié)器。為了工程化細(xì)胞代謝,無(wú)細(xì)胞生物系統(tǒng)為闡明這些代謝途徑提供了巨大的可能性。使用細(xì)胞提取物進(jìn)行蛋白質(zhì)合成的無(wú)細(xì)胞生物系統(tǒng)中,編碼酶的DNA模板的表達(dá)可以導(dǎo)致途徑在單一反應(yīng)中的自組裝,這將是極大的優(yōu)勢(shì)。迄今為止,已有幾份報(bào)告證實(shí)了這種方法。例如,分別通過(guò)無(wú)細(xì)胞生物系統(tǒng)從線性表達(dá)的DNA中重新識(shí)別出包含三個(gè)和六個(gè)酶的兩條途徑,分別生產(chǎn)N-乙酰氨基葡萄糖和肽聚糖前體。還將色氨酸轉(zhuǎn)化為purpurin的五酶途徑展示出來(lái)。此外,最近采用組合策略構(gòu)建了一個(gè)17步的酶途徑,用于n-丁醇。結(jié)合數(shù)據(jù)驅(qū)動(dòng)設(shè)計(jì),無(wú)細(xì)胞生物系統(tǒng)可以用來(lái)在大腸桿菌提取物中快速評(píng)估數(shù)百種途徑組合,以增強(qiáng)丁醇和3-羥基丁酸在革蘭氏陽(yáng)性厭氧細(xì)菌中的生產(chǎn),展示了無(wú)細(xì)胞和體內(nèi)途徑性能。
對(duì)于包括糖基化、磷酸化、PEGylation和非天然氨基酸(uAAs)的插入在內(nèi)的廣泛蛋白質(zhì)修飾,無(wú)細(xì)胞生物系統(tǒng)提供了強(qiáng)大的控制和多功能性,繞過(guò)了與基于細(xì)胞的毒性和滲透性相關(guān)的限制。研究細(xì)胞內(nèi)蛋白質(zhì)的修飾通常具有挑戰(zhàn)性,因?yàn)楹茈y在細(xì)胞內(nèi)獲得均質(zhì)修飾的蛋白質(zhì)。無(wú)細(xì)胞生物系統(tǒng)已被證明具有高度均質(zhì)的蛋白質(zhì)修飾功能。一個(gè)經(jīng)典的例子是蛋白質(zhì)上特定位點(diǎn)的糖基化。許多治療蛋白質(zhì)高度依賴于高效和均質(zhì)的糖基化。
使用大腸桿菌細(xì)胞提取物的無(wú)細(xì)胞生物系統(tǒng)是檢測(cè)糖基化的理想的試驗(yàn)場(chǎng),因?yàn)榇竽c桿菌沒(méi)有原生的糖基化功能。因此,使用無(wú)細(xì)胞技術(shù)加速無(wú)細(xì)胞中碳水化合物篩選的能力可能對(duì)糖基化治療和疫苗設(shè)計(jì)產(chǎn)生變革性影響。開(kāi)放的無(wú)細(xì)胞生物系統(tǒng)特別適用于使用由非天然tRNA和氨酰tRNA合成酶組成的正交翻譯系統(tǒng),在mRNA的UAG琥珀色終止密碼子上添加uAAs。將uAAs整合到蛋白質(zhì)中為使用修飾蛋白作為治療劑提供了無(wú)限的可能性。一旦uAAs被整合到目標(biāo)蛋白質(zhì)的精確位置,它們就作為生物正交化學(xué)手柄,與功能化小分子反應(yīng),產(chǎn)生治療偶聯(lián)物,如抗體-藥物偶聯(lián)物(ADCs)。
當(dāng)我們?cè)u(píng)估無(wú)細(xì)胞生物系統(tǒng)作為生物傳感器的作用時(shí),它們比整個(gè)細(xì)胞傳感器提供了幾個(gè)實(shí)際優(yōu)勢(shì)。無(wú)細(xì)胞生物系統(tǒng)中可以檢測(cè)到細(xì)胞壁不可滲透或細(xì)胞毒性的分析物,并且由于整個(gè)細(xì)胞傳感器中可能發(fā)生突變和質(zhì)粒丟失,它們更可靠。無(wú)細(xì)胞生物系統(tǒng)的蛋白質(zhì)合成特性可以用來(lái)宿主基于基因電路的傳感器,這些傳感器可以以極高的靈敏度和特異性檢測(cè)核酸和小分子。為了檢測(cè)主要來(lái)自病原體的病毒和細(xì)菌的核酸,將含有病原體的樣本中提取的RNA添加到無(wú)細(xì)胞生物系統(tǒng)中,該系統(tǒng)被編程為僅在存在目標(biāo)核酸序列的情況下通過(guò)設(shè)計(jì)的toehold開(kāi)關(guān)核糖調(diào)節(jié)器產(chǎn)生報(bào)告蛋白。它可以取代逆轉(zhuǎn)錄PCR(RT-PCR)進(jìn)行更快速的診斷測(cè)試。使用這種策略,可以快速檢測(cè)許多病毒,包括埃博拉、寨卡病毒、諾如病毒、黃瓜花葉病毒、SARS-CoV-2和某些腸道定植細(xì)菌。這種無(wú)細(xì)胞病毒檢測(cè)系統(tǒng)可以通過(guò)凍干技術(shù)固定在紙上,以提高其便攜性和穩(wěn)定性,為滿足當(dāng)前Covid-19和未來(lái)病毒大流行的緊急診斷需求提供替代方案。
與核酸檢測(cè)相比,在檢測(cè)小分子(例如,環(huán)境毒素或細(xì)胞代謝物)方面,無(wú)細(xì)胞檢測(cè)的進(jìn)展較慢,因?yàn)闆](méi)有合成核糖修飾的類似物用于構(gòu)建任意小分子的傳感器。大多數(shù)報(bào)道的無(wú)細(xì)胞小分子傳感器檢測(cè)環(huán)境毒素,如汞和氟化物、藥物,如γ-羥基丁酸或細(xì)菌群體感應(yīng)信號(hào),如N-丁基-L-高絲氨酸內(nèi)酯。研究表明,無(wú)細(xì)胞傳感器可以被凍干,即使在紙基質(zhì)上干燥,也能保持活性數(shù)月,為無(wú)細(xì)胞系統(tǒng)提供了一種替代手段,以滿足易于分發(fā)和低成本傳感的未滿足需求。

圖8 無(wú)細(xì)胞合成生物學(xué)系統(tǒng)的各種應(yīng)用,包括基于細(xì)胞提取物的無(wú)細(xì)胞蛋白質(zhì)合成(CFPS)系統(tǒng)和基于純化酶的系統(tǒng)。
9.2.基于純化酶的無(wú)細(xì)胞生物系統(tǒng)用于生物制造
基于純化酶的無(wú)細(xì)胞生物系統(tǒng)指的是構(gòu)建由多個(gè)純化/部分純化的酶組成的生物催化系統(tǒng),這些系統(tǒng)通過(guò)工程化的反應(yīng)途徑將特定底物轉(zhuǎn)化為所需的化合物。這里,我們專注于使用淀粉、葡萄糖、纖維素和二氧化碳等可持續(xù)底物的無(wú)細(xì)胞生物系統(tǒng)在生物制造中的應(yīng)用。
肌醇(以下簡(jiǎn)稱肌醇)和氫氣是由無(wú)細(xì)胞生物系統(tǒng)直接從淀粉生產(chǎn)的兩個(gè)典型產(chǎn)品。肌醇廣泛用于化妝品、制藥和食品工業(yè)。它通過(guò)酸水解植酸獲得。這種方法使用昂貴的原料,并且產(chǎn)生嚴(yán)重的磷污染。Zhang等人和Atomi等人都構(gòu)建了一個(gè)包含四個(gè)酶促反應(yīng)的無(wú)細(xì)胞生物系統(tǒng),可以以100%的理論產(chǎn)率將淀粉轉(zhuǎn)化為肌醇。這個(gè)生物系統(tǒng)中的所有酶都是嗜熱的,因此可以通過(guò)熱處理輕松純化酶,并在高反應(yīng)溫度下避免微生物污染。與傳統(tǒng)的化學(xué)方法相比,這種從淀粉生產(chǎn)肌醇的新方法具有巨大的綠色生產(chǎn)潛力。
目前,博浩達(dá)生物(中國(guó))正在建設(shè)一個(gè)工業(yè)設(shè)施,以擴(kuò)大這種新方法生產(chǎn)肌醇。許多其他附加值化學(xué)品,如氨基葡萄糖、阿洛糖和(-)-維博醇,可以通過(guò)類似的淀粉酶處理合成。
氫氣是未來(lái)的交通燃料,通過(guò)燃料電池提高能效有潛力減少溫室氣體排放,為最終用戶提供零污染物。自然細(xì)胞代謝途徑每摩爾葡萄糖只能產(chǎn)生最多4摩爾的H2。Zhang和同事進(jìn)行了一個(gè)概念驗(yàn)證實(shí)驗(yàn),通過(guò)包含13種純化酶的無(wú)細(xì)胞生物系統(tǒng),每摩爾葡萄糖產(chǎn)生了12摩爾的H2。該生物系統(tǒng)幾乎定量地將淀粉轉(zhuǎn)化為H2和CO2,其總計(jì)量化學(xué)方程式為:C6H10O5+7H2O=12H2+6CO2。這個(gè)生物系統(tǒng)可以稍微修改,以開(kāi)發(fā)能量密度比鋰離子電池高一個(gè)數(shù)量級(jí)的糖生物電池。這個(gè)無(wú)細(xì)胞生物系統(tǒng)為氫氣生產(chǎn)奠定了基礎(chǔ),為未來(lái)的糖-氫車輛。
當(dāng)葡萄糖被用作無(wú)細(xì)胞生物系統(tǒng)中的底物時(shí),這里描述的是乙醇、異丁醇和烯烴天然化合物的生產(chǎn)。乙醇是最重要的汽油添加劑,異丁醇是與當(dāng)前內(nèi)燃機(jī)和運(yùn)輸管道兼容的四碳液體醇。Sieber和同事設(shè)計(jì)了一個(gè)無(wú)細(xì)胞生物系統(tǒng),可以通過(guò)丙酮酸從葡萄糖生產(chǎn)乙醇和異丁醇。與傳統(tǒng)的糖酵解途徑中使用的10種酶相比,這個(gè)生物系統(tǒng)僅使用四種酶將葡萄糖轉(zhuǎn)化為丙酮酸,然后可以轉(zhuǎn)化為乙醇和異丁醇。即使在4%(v/v)異丁醇存在的情況下,這個(gè)無(wú)細(xì)胞生物系統(tǒng)也能大量生產(chǎn)異丁醇,而即使是低濃度(例如,1%-2% v/v)也會(huì)阻止微生物生產(chǎn)異丁醇。這一進(jìn)展表明,無(wú)細(xì)胞生物系統(tǒng)對(duì)有毒環(huán)境具有高度耐受性。為了生產(chǎn)烯烴天然化合物,Bowie和同事設(shè)計(jì)了一個(gè)由20多種酶組成的無(wú)細(xì)胞生物系統(tǒng)。這些酶可以被劃分為4個(gè)主要反應(yīng)模塊:一個(gè)從葡萄糖生產(chǎn)丙酮酸的糖酵解模塊;一個(gè)從丙酮酸生產(chǎn)乙酰輔酶A的乙酰輔酶A模塊,以及一個(gè)從乙酰輔酶A生產(chǎn)萜基焦磷酸(GPP)的甲羥戊酸模塊;以及一個(gè)生產(chǎn)所需烯烴產(chǎn)物的烯烴化模塊。烯烴化模塊也可以通過(guò)使用替代酶和底物來(lái)調(diào)節(jié),以生產(chǎn)各種烯烴化合物,如異戊二烯(重復(fù)詞)和大麻素。經(jīng)過(guò)系統(tǒng)優(yōu)化后,這個(gè)無(wú)細(xì)胞生物系統(tǒng)產(chǎn)生了1.25 g L−1的大麻素滴度,至少比使用活細(xì)胞的結(jié)果高出兩個(gè)數(shù)量級(jí)。
當(dāng)纖維素被用作底物時(shí),一個(gè)典型的例子是無(wú)細(xì)胞系統(tǒng)通過(guò)纖維素生產(chǎn)淀粉。這個(gè)生物系統(tǒng)包含內(nèi)切纖維素酶、纖維二糖水解酶、纖維二糖磷酸化酶和α-葡萄糖磷酸化酶,用于將預(yù)處理的生物質(zhì)一鍋法酶轉(zhuǎn)化生產(chǎn)淀粉。高達(dá)30%的纖維素中的脫水葡萄糖單元被轉(zhuǎn)化為淀粉。由于纖維素原料的年來(lái)源大約是食品和飼料淀粉的40倍,這種將非食品纖維素轉(zhuǎn)化為淀粉的成本效益轉(zhuǎn)化可以重塑生物經(jīng)濟(jì),并解決食品、生物燃料和環(huán)境的三重困境。
中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所的研究人員構(gòu)建了一條人工淀粉合成途徑(ASAP),利用二氧化碳和氫氣合成淀粉。ASAP是一個(gè)化學(xué)-生物混合系統(tǒng),包括一個(gè)化學(xué)系統(tǒng)和一個(gè)無(wú)細(xì)胞生物系統(tǒng)。化學(xué)系統(tǒng)將二氧化碳和氫氣轉(zhuǎn)化為甲醇。無(wú)細(xì)胞生物系統(tǒng)包含11個(gè)核心酶和3個(gè)輔助酶,將甲醇轉(zhuǎn)化為淀粉。在對(duì)模塊組裝、替代和三個(gè)速率限制酶的蛋白質(zhì)工程進(jìn)行條件優(yōu)化后,這個(gè)化學(xué)-生物混合系統(tǒng)以每毫克總催化劑每分鐘22納摩爾的速率將二氧化碳轉(zhuǎn)化為淀粉,這比玉米底物系統(tǒng)中的速率高出8.5倍。這種方法提供了一種潛在的全球糧食供應(yīng)策略,更重要的是,為探索其他星球時(shí)的食物來(lái)源問(wèn)題提供了潛在的解決方案。
總之,無(wú)細(xì)胞合成生物學(xué)提供了一個(gè)改變游戲規(guī)則的工具,可以繞過(guò)活細(xì)胞固有的限制。在不同領(lǐng)域,包括基因表達(dá)、遺傳網(wǎng)絡(luò)、蛋白質(zhì)修飾、按需生物傳感和使用無(wú)細(xì)胞生物系統(tǒng)進(jìn)行生物制造的研究中,無(wú)細(xì)胞合成生物學(xué)的前景是顯而易見(jiàn)的。然而,要實(shí)現(xiàn)無(wú)細(xì)胞生物系統(tǒng)的真正潛力,需要克服幾個(gè)挑戰(zhàn),包括這些生物系統(tǒng)的壽命和不穩(wěn)定的天然輔因子的再生。在解決這些缺陷之后,無(wú)細(xì)胞合成生物學(xué)將把生物學(xué)和生物技術(shù)帶入一個(gè)新時(shí)代,帶來(lái)許多有趣的結(jié)果??吹綗o(wú)細(xì)胞合成生物學(xué)與材料科學(xué)、電子學(xué)、計(jì)算機(jī)和人工智能等其他尖端學(xué)科相結(jié)合,這是令人興奮的。
10.人工智能和合成生物學(xué)
獲得理想的生物組件是構(gòu)建合成生物學(xué)系統(tǒng)的基礎(chǔ)。隨著最近計(jì)算能力的增加,人工智能(AI)已被證明在各種具有挑戰(zhàn)性的任務(wù)中表現(xiàn)出色,例如圖像生成、自然語(yǔ)言處理和合成生物學(xué)應(yīng)用。本節(jié)將簡(jiǎn)要描述在挖掘復(fù)雜生物學(xué)屬性和設(shè)計(jì)優(yōu)化的合成生物學(xué)組件(生物部件)方面越來(lái)越成功的AI依賴方法,特別是基因調(diào)控序列。有關(guān)特定應(yīng)用的深入討論,如代謝工程、基因治療和藥物發(fā)現(xiàn),有優(yōu)秀的綜述可供參考。
10.1.AI引導(dǎo)的生物部件逆向設(shè)計(jì)的一般框架
生物部件設(shè)計(jì)是一個(gè)重要但復(fù)雜的任務(wù),旨在基于特定目標(biāo)屬性逆向工程新的生物分子。從實(shí)驗(yàn)上講,窮盡搜索潛在的序列空間以發(fā)現(xiàn)新的生物部件(例如,100個(gè)堿基對(duì)的DNA序列形成一個(gè)潛在的序列空間4^100)是非常困難的。因此,虛擬篩選為探索這個(gè)廣闊的空間提供了一個(gè)有希望的替代方案。有了可以估計(jì)序列空間適應(yīng)度景觀的計(jì)算模型,現(xiàn)在可以選擇具有高適應(yīng)度的候選設(shè)計(jì),并采用迭代過(guò)程實(shí)現(xiàn)生物部件的有效虛擬篩選(圖9A)。

圖9 A, 生物部件設(shè)計(jì)的設(shè)計(jì)與構(gòu)建-測(cè)試-學(xué)習(xí)(DBTL)流程示意圖。生物部件設(shè)計(jì)將AI引導(dǎo)的虛擬篩選、生物部件合成、生物測(cè)量和功能特征學(xué)習(xí)整合到一個(gè)閉環(huán)框架中。B, 關(guān)于生成模型和預(yù)測(cè)模型的框架。
從機(jī)器學(xué)習(xí)的角度來(lái)看,生物部件的逆向設(shè)計(jì)問(wèn)題可以抽象為估計(jì)生物部件功能聯(lián)合分布的數(shù)學(xué)問(wèn)題,并從中采樣目標(biāo)生物部件x和目標(biāo)功能y。在目標(biāo)功能y的情況下,生物部件設(shè)計(jì)問(wèn)題可以以概率形式表述為尋找相互兼容的序列-功能對(duì),以最大化聯(lián)合概率p(x,y)。使用概率鏈規(guī)則,我們可以得到:p(x,y)=p(y∣x)⋅p(x)其中第一項(xiàng)表示給定序列x的功能y的條件概率,第二項(xiàng)表示受到化學(xué)和生物物理屬性限制的序列x的生物兼容性。機(jī)器學(xué)習(xí)方法的發(fā)展,特別是深度學(xué)習(xí),使得適應(yīng)度環(huán)境的估計(jì)越來(lái)越準(zhǔn)確,并顯著提高了生成滿足生物學(xué)約束條件的候選設(shè)計(jì)的效率。將虛擬篩選和高通量實(shí)驗(yàn)篩選結(jié)合在一個(gè)閉環(huán)中,促進(jìn)了虛擬篩選的迭代優(yōu)化,并進(jìn)一步加快了設(shè)計(jì)進(jìn)展(圖9A)。
10.2.深度學(xué)習(xí)模型在合成生物學(xué)中的應(yīng)用
隨著計(jì)算能力的增強(qiáng)和高通量組學(xué)數(shù)據(jù)的增加,深度學(xué)習(xí)的使用已成為學(xué)習(xí)復(fù)雜模式和隱式或顯式高效估計(jì)數(shù)據(jù)分布的有希望的方法。我們簡(jiǎn)要介紹了在生物組件設(shè)計(jì)中廣泛使用的兩類主要深度學(xué)習(xí)模型:預(yù)測(cè)模型和生成模型。預(yù)測(cè)模型:為了估計(jì)項(xiàng)p(y/x),構(gòu)建了預(yù)測(cè)模型以評(píng)估在輸入生物部件
來(lái)源:藥時(shí)空