引言
蛋白质序列上的氨基酸突变可导致蛋白质功能发生变化,并与酶失活、遗传疾病和病毒免疫逃逸等生物过程密切相关。精确预测氨基酸突变效应对指导蛋白质设计改造等下游应用具有显著意义。通过探索蛋白质适应度景观并识别潜在有利突变,突变效应预测方法能够解决定向进化和理性设计策略面临的诸多挑战,并可缩短时间周期、降低人力成本、避免对拟改造蛋白结构与功能的先验知识依赖等。然而,由于庞大的突变体空间、复杂的氨基酸相互作用和突变上位效应,突变效应预测和涉及数十点突变的蛋白质设计改造仍然困难重重。2024年7月5日,军事医学研究院生物信息中心王升启、舒文杰研究员团队联合南京医科大学生殖医学与子代健康全国重点实验室张军研究员团队和之江实验室朱世强教授团队在Cell Research杂志在线发表了题为Zero-shot prediction of mutation effects with multimodal deep representation learning guides protein engineering的研究。该研究首次同时以亿级蛋白质序列和结构数据为学习对象,构建了一个多模态蛋白质深度表征学习模型,系统挖掘了蛋白质序列分布知识和空间折叠规律。在此基础上,研究团队开发了一种不依赖多序列比对(MSA-free)和现有实验数据(零样本)的突变效应预测方法,ProMEP (Protein Mutational Effect Predictor),同时利用蛋白质序列和结构上下文精确预测氨基酸突变效应,预测速度比现有最优方法AlphaMissense快2-3个数量级,并在实际指导蛋白质设计改造方面展现了巨大的应用潜力!


最后,研究团队以TnpB核酸酶和TadA脱氨酶为改造对象,实际验证ProMEP能否准确识别潜在有利突变,并以此指导蛋白质设计改造。实验结果表明:
(1)针对所验证的Top 10的有利突变和不利突变,ProMEP有利突变预测准确率达50%-70%,不利突变预测准确率100%。
(2)以ProMEP设计的TnpB 五点突变体构建的ABE/CBE碱基编辑器,相比野生型TnpB构建的ABE/CBE编辑器分别实现1.91-26.9、2.17-16.54倍编辑效率提升。
(3)以ProMEP设计的TadA十五点突变体构建的ABE碱基编辑器在A5/A6位置上的A-to-G编辑效率和旁编辑效应与经典的ABE9相当,且脱靶率优于ABE8e。综上所述,该工作创新性的开发了一种基于多模态大模型的突变效应预测方法(ProMEP)。该方法在模型架构、训练数据类型及规模、模型性能和下游应用上均有突破,为破译蛋白质结构与功能密码、探索庞大蛋白质突变空间、预测突变效应并指导蛋白质设计改造提供了全新策略。随着各类蛋白质多样化改造需求不断增加,ProMEP零样本且MSA-free的特性尤为重要,有望显著降低蛋白质设计改造难度和实验成本,为生物学家快速研制高性能酶分子提供有利手段。参考文献
https://www.nature.com/articles/s41422-024-00989-2
责编|探索君
排版|探索君
文章来源|“BioArt”
End
往期精选
围观
一文读透细胞死亡(Cell Death) | 24年Cell重磅综述(长文收藏版)热文
Cell | 是什么决定了细胞的大小?热文
Nature | 2024年值得关注的七项技术热文
Nature | 自身免疫性疾病能被治愈吗?科学家们终于看到了希望热文
CRISPR技术进化史 | 24年Cell综述