蛋白質(zhì)是生命活動的主要承擔(dān)者。通過對蛋白質(zhì)進行功能聚類,是理解其參與的生理過程、設(shè)計新型蛋白質(zhì)等的重要手段?,F(xiàn)有的方法主要基于氨基酸一級序列的相似性對蛋白質(zhì)進行聚類分析,并以此推斷其功能和演化關(guān)系。然而,蛋白質(zhì)功能由其三維空間結(jié)構(gòu)所決定,開發(fā)基于三維結(jié)構(gòu)的高通量蛋白質(zhì)聚類方法,將為蛋白質(zhì)功能研究提供更直接、可靠的手段,并推動未知蛋白質(zhì)的功能挖掘。
堿基編輯系統(tǒng)可以實現(xiàn)單核苷酸精度的DNA或RNA精準(zhǔn)編輯,是基因功能研究、疾病治療、生物育種的變革性技術(shù)。然而,現(xiàn)有堿基編輯系統(tǒng)的核心元件脫氨酶來源于單一家族,導(dǎo)致堿基編輯仍有諸多局限,編輯尚難以滿足多元化的應(yīng)用需求。而且,現(xiàn)有堿基編輯系統(tǒng)的底層專利由國外持有,我國亟需擁有具自主知識產(chǎn)權(quán)的堿基編輯系統(tǒng)。脫氨酶是堿基編輯系統(tǒng)的核心元件,因此,創(chuàng)新地挖掘新型脫氨酶,開發(fā)適用于不同應(yīng)用場景的新型堿基編輯工具顯得尤為重要。
????2023年6月27日,中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞研究組在Cell發(fā)表了題為Discovery of deaminase functions by structure-based protein clustering的研究論文。該研究創(chuàng)新性地運用AI輔助的大規(guī)模蛋白結(jié)構(gòu)預(yù)測,建立起全新的基于三級結(jié)構(gòu)的高通量蛋白聚類方法,實現(xiàn)了脫氨酶功能結(jié)構(gòu)的深入挖掘,鑒定到完全區(qū)別于已知脫氨工具酶的全新底盤元件,并成功開發(fā)了一系列具有我國自主知識產(chǎn)權(quán)的新型堿基編輯工具。
????研究人員首先通過蛋白質(zhì)結(jié)構(gòu)預(yù)測模型AlphaFold2對具有代表性的脫氨功能序列進行批量三維結(jié)構(gòu)預(yù)測,隨后創(chuàng)新性地開展了基于三維結(jié)構(gòu)的蛋白質(zhì)多重比對與聚類,成功將潛在的脫氨酶劃分為20個不同的分支。除已報道的APOBEC/AID胞嘧啶脫氨酶外,研究人員又檢測到了5個結(jié)構(gòu)、序列全新的具有活性的胞嘧啶脫氨酶分支。在這些分支中,研究人員對具有類DddA (Double-stranded DNA deaminase toxin A-like)脫氨結(jié)構(gòu)域的蛋白進行進一步結(jié)構(gòu)聚類和功能驗證,發(fā)現(xiàn)除以前推測的具有雙鏈DNA脫氨活性的蛋白外,該分支還包含了大量只具有單鏈DNA脫氨活性的蛋白,該結(jié)果顛覆了之前對該類蛋白功能的認知。以上研究表明,當(dāng)?shù)鞍准系男蛄型葱暂^低且功能多樣時,相比于傳統(tǒng)的基于氨基酸一級序列的聚類方法,通過AI輔助的蛋白質(zhì)結(jié)構(gòu)聚類能夠得到更準(zhǔn)確的結(jié)果。因此,該方法為蛋白質(zhì)功能分析和挖掘提供了一個高效、可靠的新策略。
????研究人員基于上述進一步聚類的結(jié)果,全新鑒定到45個單鏈胞嘧啶脫氨酶(Sdd)和13個雙鏈胞嘧啶脫氨酶(Ddd)。這些脫氨酶是目前唯一全部來自于原核生物(細菌)的脫氨酶,而現(xiàn)有APOBEC/AID脫氨酶家族成員都來自于真核生物(主要包括人、哺乳動物或魚類)。研究人員基于這些脫氨酶開發(fā)了一系列新型堿基編輯系統(tǒng),并在動、植物細胞中進行了測試。結(jié)果表明,新開發(fā)的基于Ddd1和Ddd9脫氨酶的雙鏈堿基編輯系統(tǒng)克服了常規(guī)編輯器對GC序列編輯效率明顯降低的缺陷;基于Sdd7和Sdd3的單鏈堿基編輯系統(tǒng)展現(xiàn)出了非常高的編輯活性,在GC序列同樣具有可觀的堿基編輯能力;基于Sdd6的單鏈堿基編輯系統(tǒng)則展現(xiàn)出了極高的特異性,幾乎檢測不到脫靶事件。研究人員進一步通過蛋白理性設(shè)計和功能驗證,開發(fā)了新型的可被單個腺相關(guān)病毒(AAV)包被的Sdd6-CBE堿基編輯器,在小鼠細胞系中成功獲得高達43.1%的編輯效率, 解決了常規(guī)堿基編輯器過大而無法被腺病毒顆包被遞送的難題。此外,針對大豆中長期存在堿基編輯效率低下的問題,研究團隊新開發(fā)了Sdd7-CBE系統(tǒng),在154株大豆陽性苗中獲得了34株穩(wěn)定編輯的植株,編輯效率高達22.1%。這些脫氨酶是目前唯一全部來自于原核生物(細菌)的脫氨酶,而現(xiàn)有APOBEC/AID脫氨酶家族成員都來自于真核生物(主要包括人、哺乳動物或魚類)。研究突破了現(xiàn)有脫氨酶的應(yīng)用瓶頸,展現(xiàn)出新型堿基編輯系統(tǒng)在醫(yī)學(xué)和農(nóng)業(yè)方面廣泛的應(yīng)用前景。
圖:基于AI輔助的蛋白結(jié)構(gòu)聚類挖掘脫氨酶并開發(fā)具有新特性的堿基編輯系統(tǒng)。
????綜上所述,該項工作為蛋白功能分析、新功能元件挖掘提供了全新策略。新研發(fā)的堿基編輯系統(tǒng)是具有我國自主知識產(chǎn)權(quán)的精準(zhǔn)基因編輯技術(shù),有望打破堿基編輯底層專利壟斷,將幫助我國在未來的生物技術(shù)產(chǎn)業(yè)競爭中處于有利地位。
????中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所高彩霞研究組博士后黃佳穎、林秋鵬,博士生費宏源、賀子欣為該論文的并列第一作者;高彩霞研究員與齊禾生科生物科技有限公司的Kevin Tianmeng Zhao博士為本文共同通訊作者。
????原文鏈接:https://www.cell.com/cell/fulltext/S0092-8674(23)00593-7