2024年諾貝爾化學(xué)獎授予戴維-貝克(David Baker)、戴米斯-哈薩比斯(Demis Hassabis)和約翰-朱伯(John M. Jumper),以表彰他們在蛋白質(zhì)設(shè)計和結(jié)構(gòu)預(yù)測領(lǐng)域做出的杰出貢獻(xiàn)。DeepMind團(tuán)隊(duì)的AlphaFold3憑借其強(qiáng)大的結(jié)構(gòu)預(yù)測統(tǒng)一框架,為藥物開發(fā)開辟了新的可能性,并有可能顛覆當(dāng)前的藥物發(fā)現(xiàn)模式。
AI + 蛋白質(zhì)市場規(guī)模
目前,對蛋白質(zhì)的AI開發(fā)主要集中在預(yù)測蛋白質(zhì)本身的結(jié)構(gòu)和功能,預(yù)測蛋白質(zhì)與其他生物大分子的相互作用,以及蛋白質(zhì)設(shè)計和蛋白質(zhì)組學(xué)分析等方面。在工業(yè)應(yīng)用中,“AI+蛋白質(zhì)設(shè)計 ”所占比例最高。目前,這些預(yù)測技術(shù)已更多地嵌入到現(xiàn)有的藥物開發(fā)和蛋白質(zhì)工程流程中。
根據(jù)MedMarket Insights的數(shù)據(jù),AI蛋白質(zhì)市場規(guī)模在2023年達(dá)到14.83億美元,預(yù)計到2031年將增長到178億美元,復(fù)合年增長率約為36.5%,這主要得益于AI宏模型對生命科學(xué)的高度適應(yīng)性。
數(shù)據(jù)來源: MedMarket Insights, 2023
從全球市場來看,美國是全球AI蛋白質(zhì)研究和應(yīng)用的領(lǐng)導(dǎo)者,約占市場份額的58%。歐洲占22%,亞洲(主要是中國和一些日本公司)約占12%的市場份額,英國和中東分別占4%和2%,其他地區(qū)占2%。
全球蛋白質(zhì)AI市場分布預(yù)測
數(shù)據(jù)來源: MedMarket Insights, 2023
AI + 蛋白質(zhì)應(yīng)用場景
隨著以深度學(xué)習(xí)為代表的AI(AI)技術(shù)的發(fā)展,為蛋白質(zhì)研究提供了另一種思路,帶來了方法、流程和思維的創(chuàng)新。特別是以 AlphaFold 為代表的突破性創(chuàng)新,AI在蛋白質(zhì)結(jié)構(gòu)預(yù)測、優(yōu)化設(shè)計和組學(xué)研究方面取得了重大進(jìn)展。同時,這些技術(shù)已經(jīng)從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用,覆蓋了蛋白質(zhì)設(shè)計、藥物發(fā)現(xiàn)、合成生物學(xué)等多個領(lǐng)域。
1、蛋白質(zhì)設(shè)計
AI蛋白質(zhì)設(shè)計可分為兩個主要方向:蛋白質(zhì)優(yōu)化和蛋白質(zhì)從頭設(shè)計。
從功能到序列的蛋白質(zhì)設(shè)計只需要確定能實(shí)現(xiàn)該功能的氨基酸序列。蛋白質(zhì)優(yōu)化涉及修改天然序列(定向進(jìn)化)以增強(qiáng)其特定功能,如增強(qiáng)親和力、提高催化活性和穩(wěn)定性。從零開始的蛋白質(zhì)設(shè)計,包括從結(jié)構(gòu)設(shè)計序列、從功能設(shè)計序列和從功能設(shè)計結(jié)構(gòu),這也是David Baker 教授及其團(tuán)隊(duì)特別成功的領(lǐng)域。
2、藥物發(fā)現(xiàn)
AI蛋白質(zhì)預(yù)測和蛋白質(zhì)設(shè)計可以大大加快新藥研發(fā)的進(jìn)程。通過預(yù)測蛋白質(zhì)的結(jié)構(gòu)和功能,模擬蛋白質(zhì)與其他生物大分子的相互作用過程,可以準(zhǔn)確確定藥物與靶點(diǎn)的結(jié)合位點(diǎn),為藥物研發(fā)提供有力支持。此外,基于AI的端到端蛋白質(zhì)設(shè)計技術(shù)可以實(shí)現(xiàn)從無到有,設(shè)計出具有特定功能的蛋白質(zhì)類藥物。同時,將AI與蛋白質(zhì)組學(xué)數(shù)據(jù)相結(jié)合,可以系統(tǒng)分析人體內(nèi)蛋白質(zhì)、疾病和藥物之間的關(guān)聯(lián),補(bǔ)充靶點(diǎn)庫,加速藥物研發(fā)進(jìn)程。
約85% 的人類疾病相關(guān)蛋白質(zhì)靶點(diǎn)難以成為藥物,因?yàn)橛行┑鞍踪|(zhì)難以分析和觀察,即使使用電子顯微鏡和核磁共振等傳統(tǒng)方法,也只能觀察到其靜態(tài)結(jié)構(gòu)。AI技術(shù)為藥物發(fā)現(xiàn)和開發(fā)提供了新的工具和方法,以解決難以成藥的靶點(diǎn),有望改變傳統(tǒng)的藥物發(fā)現(xiàn)模式,提高藥物發(fā)現(xiàn)的效率和成功率。
3、合成生物學(xué)
在合成生物學(xué)領(lǐng)域,通過精確控制和改變蛋白質(zhì)的結(jié)構(gòu)和功能,為農(nóng)業(yè)、食品和制藥業(yè)提供了創(chuàng)新解決方案。這具有巨大的應(yīng)用潛力和經(jīng)濟(jì)價值。
在農(nóng)業(yè)領(lǐng)域,AI可以改良作物蛋白質(zhì),提高產(chǎn)量和質(zhì)量,減少環(huán)境污染。2021 年,NotCo 公司推出了AI平臺 Giuseppe,利用AI設(shè)計和預(yù)測植物性蛋白質(zhì)的結(jié)構(gòu),模仿動物性食品中的營養(yǎng)成分和口感,為植物性食品的開發(fā)提供優(yōu)化建議。
在食品領(lǐng)域,AI可以幫助開發(fā)營養(yǎng)更豐富、成本更低廉的優(yōu)質(zhì)蛋白質(zhì)。合成生物學(xué)公司 Arzeda 在酶改性領(lǐng)域取得了重大成果,利用其先進(jìn)的酶改性平臺開發(fā)出了可高效轉(zhuǎn)化甜味劑并降低生產(chǎn)成本的酶。此外,Arzeda 還為英國石油公司開發(fā)了新型酶,以提高石油開采和生產(chǎn)過程的效率。
如何將設(shè)計的蛋白質(zhì)轉(zhuǎn)化為“實(shí)際功能蛋白質(zhì)”?
1. 設(shè)計蛋白質(zhì)
? 功能位點(diǎn)鑒定: 第一步是確定蛋白質(zhì)的功能位點(diǎn),該位點(diǎn)負(fù)責(zé)蛋白質(zhì)的生化活性。
? 序列設(shè)計: 研究人員利用深度學(xué)習(xí)算法設(shè)計氨基酸序列,使其能折疊成包含所需功能位點(diǎn)的三維(3D)結(jié)構(gòu)。這一步尤其具有挑戰(zhàn)性,因?yàn)樗枰獎?chuàng)建一個具有功能區(qū)(如活性位點(diǎn)或結(jié)合界面)的穩(wěn)定的整體支架,并設(shè)計一個可折疊成該結(jié)構(gòu)的序列。
2. 驗(yàn)證和優(yōu)化
? 性能驗(yàn)證: 在進(jìn)行實(shí)驗(yàn)之前,要對設(shè)計的蛋白質(zhì)進(jìn)行計算驗(yàn)證。這包括檢查蛋白質(zhì)的穩(wěn)定性,確保功能位點(diǎn)位置正確,并預(yù)測其與其他分子的相互作用。
? 優(yōu)化: 在計算驗(yàn)證的基礎(chǔ)上,設(shè)計可能會經(jīng)過幾輪優(yōu)化,以提高其穩(wěn)定性、功能性和在生物系統(tǒng)中的表達(dá)。
3. 合成與表達(dá)
? 基因合成: 獲得優(yōu)化的蛋白質(zhì)序列后,下一步就是合成相應(yīng)的基因。這可以通過DNA 合成技術(shù)來完成,目前這種技術(shù)已經(jīng)高度自動化,而且效率很高。
? 蛋白表達(dá): 然后將合成的基因克隆到合適的宿主細(xì)胞(如細(xì)菌、酵母或哺乳動物細(xì)胞)中進(jìn)行蛋白質(zhì)表達(dá)。在最佳條件下培養(yǎng)宿主細(xì)胞,以促進(jìn)所需蛋白質(zhì)的高水平表達(dá)。
4. 純化和表征
? 蛋白純化: 表達(dá)后,利用各種生化技術(shù)(如層析和電泳)從宿主細(xì)胞中純化蛋白質(zhì)。這一步驟可確保蛋白質(zhì)不含污染物和雜質(zhì)。
? 表征分析:然后使用光譜、電泳和質(zhì)譜等各種生物化學(xué)和生物物理方法對純化的蛋白質(zhì)進(jìn)行表征。這些方法可提供有關(guān)蛋白質(zhì)結(jié)構(gòu)、穩(wěn)定性和功能特性的信息。
5. 蛋白功能測試
通過使用特定的檢測方法來測試蛋白質(zhì)的功能特性,以測量其活性或與目標(biāo)分子的結(jié)合親和力。這些檢測方法包括酶活性測量、結(jié)合實(shí)驗(yàn)或細(xì)胞檢測。
泓迅生物
讓AI設(shè)計的蛋白質(zhì)“活”起來
泓迅生物結(jié)合AI設(shè)計和合成生物學(xué)的力量,提供從蛋白質(zhì)序列優(yōu)化、表達(dá)到功能驗(yàn)證的全面支持,促進(jìn)蛋白質(zhì)預(yù)測的下游應(yīng)用研究,讓AI設(shè)計的蛋白質(zhì)“活”起來。
AI-Drivern 深度 DNA 合成
Syno GS 平臺擁有多種智能生物分析工具,包括 Syno Ab、NG Codon、Complexity Index (CI) 和 AI-TAT。您只需提供想要合成的核苷酸或氨基酸序列,我們就會提供 100% 精確的基因序列,并克隆到您指定的載體中。精確的基因序列可以提高蛋白質(zhì)表達(dá)的準(zhǔn)確性和效率。
AI 驅(qū)動器深度 DNA 合成
實(shí)現(xiàn)從序列到結(jié)構(gòu)再到功能的轉(zhuǎn)變
泓迅生物提供細(xì)菌、酵母、昆蟲和哺乳動物四種蛋白質(zhì)表達(dá)系統(tǒng)選擇。從毫克到克,我們的合成生物學(xué)平臺和NG Condon 優(yōu)化技術(shù)可生產(chǎn)出高純度的活性蛋白質(zhì),加速您的研究。根據(jù)蛋白質(zhì)的性質(zhì)和客戶的具體要求,我們從一系列表達(dá)載體、表達(dá)宿主和融合標(biāo)簽中精心挑選,以提供最佳結(jié)果。我們?yōu)槭澜绺鞯氐目茖W(xué)家提供定制服務(wù)。
蛋白表達(dá)服務(wù)流程
助力抗體發(fā)現(xiàn)
AlphaFold 擅長預(yù)測蛋白質(zhì)結(jié)構(gòu),但無法模擬蛋白質(zhì)與其他蛋白質(zhì)或藥物分子相互作用時的變化。泓迅生物的 Syno Ab 抗體平臺以 AlphaFold 預(yù)測的抗原結(jié)構(gòu)為起點(diǎn),解決了這一局限性。它以抗體生物醫(yī)學(xué)生物計算為支撐,有效模擬抗原-抗體對接,將計算技術(shù)與實(shí)驗(yàn)方法相結(jié)合,幫助研究人員大幅降低抗體開發(fā)的總體成本,縮短開發(fā)周期。
服務(wù)流程
References
1.ABRAMSON, Josh, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 2024, 1-3.
2.CHEN, Lingtao, et al. AI-Driven Deep Learning Techniques in Protein Structure Prediction. International journal of molecular sciences, 2024, 25.15: 8426.
3. GOEL, Divya; KUMAR, Ravi; KUMAR, Sudhir. AI-Assisted Methods for Protein Structure Prediction and Analysis. In: Microbial Data Intelligence and Computational Techniques for Sustainable Computing. Singapore: Springer Nature Singapore, 2024. p. 365-391.
4. Yoshida Hiroyuki,[Deep Learning and AlphaGo].[J] .Brain Nerve, 2019, 71: 681-694.
5. Niazi Sarfaraz K,Molecular Biosimilarity-An AI-Driven Paradigm Shift.[J] .Int J Mol Sci, 2022, 23.
6. Liu Z, Zhang Y, Nielsen J. Synthetic biology of yeast[J]. Biochemistry, 2019, 58(11): 1511-1520.