图1. 计算设计人工酶发展历史进程中的关键代表性工作
近年来,基于蛋白质本身的物理化学原理,学界发展出以Rosetta Design为代表的一系列计算策略,研究人员可以按需快速创造具有新功能的酶制剂,甚至从头创造人工酶实现自然界无法催化的生物化学反应,如催化Kemp 消除反应 (Kemp elimination reaction)、羟醛缩合反应 (Retro-aldol reaction)、狄尔斯-阿尔德反应 (Diels-Alder reaction)等。尽管从头设计技术展现了激动人心的应用前景,目前该技术还存在设计成功率不高、酶催化活性较低等科技挑战,寥寥数个成功实现的从头设计人工酶案例让整个领域陷入了对未来发展方向的沉思。
相比之下,借助于天然酶骨架的新功能重设计技术逐步走入人们视野,例如Siegel 等利用新酶重设计技术创建催化甲醛聚合的甲醛聚合酶Formolase,并成功将该酶应用于生物代谢途径,创造了以二氧化碳为原料合成羟基丙酮的人工合成途径。2018年,吴边团队针对微生物体系中极为稀缺、底物特异性极高的氢胺化酶进行功能重塑,在世界上首次通过完全的计算指导,获得了工业级微生物工程菌株,取得了计算驱动生物制造在工业化应用层面的率先突破(Nat. Chem. Biol. 2018, 14(7): 664-670)。随后,该团队进一步重构了完整的酶活性中心,打破了生物体系内氢胺化反应非天然底物无法兼容的瓶颈,成功创造出超广谱微生物氢胺化反应路径,为合成生物学所需的新型底层生命砌块创造了平台制备体系(Nat. Catal. 2021, 4: 364–373)。该篇综述归纳了利用重设计技术获得酶功能重塑的成功案例,这些高效人工酶的成功设计充分证明了新酶重设计策略具有巨大的发展潜力。
图2. 利用新酶重设计策略进行功能重塑的流程及代表性工作
随后,作者探讨了大数据和人工智能的发展为酶设计带来的新契机。伴随人工智能发展的浪潮以及测序数据的积累,一大批数据驱动型的蛋白质计算设计方法不断涌现,设计出腺相关病毒衣壳蛋白、蛋白质传感器、蛋白质逻辑门、跨膜蛋白和结合新冠病毒的小蛋白等案例。同时,AlphaFold横空出世,对于有天然稳定结构的蛋白质结构预测问题基本得到了解决。在AlphaFold掀起的浪潮下,发展数据驱动的“黑箱模型”已成为大势所趋。然而,相对于蛋白质结构,酶的催化机制更为复杂,且数据表征方法不统一,缺乏大规模的专业性数据集。需要专业的机构通过大量人力、时间的投入,搜索、处理、建立高精度标注数据,实现“黑箱模型”的高质量训练,作者期待未来通过高精度数据获得的训练模型可进一步进行知识发现来把“黑箱”变成“白箱”。
在综述文章最后,作者对基于蛋白质本身物理化学原理的计算设计方法以及数据驱动的计算方法进行详细总结,并对这些策略目前的局限性和未来发展方向进行了讨论和展望。近年来“计算机蛋白质设计”技术蓬勃兴起,拓宽了人们对蛋白质结构与功能组织层次的认知,并为生物大数据时代下合成生物学注入新动能。该篇综述立足于全新的视角对目前计算设计人工酶领域的前沿技术进行梳理总结与科学展望,为计算设计与生物产业的互作融合提供支持。
永乐高ylg888888吴边研究组的崔颖璐副研究员为该综述的第一作者,吴边研究员为通讯作者。该综述的撰写获得了国家重点研发计划合成生物学专项(2018YFA0901600)、国家自然科学基金优秀青年基金项目(31870055)、国家自然科学基金面上项目(31822002、32170033)中国科学院战略生物资源服务网络计划生物资源衍生库(KFJ-BRP-009、KFJ-BRP-017-58)、中国科学院网络安全和信息化专项应用示范项目(CAS-WX2021PY-0101)以及中国科学院青年创新促进会的资助。