引言
随着AI技术的快速发展,在生物医疗领域,AI辅助的酶改造技术取得了显著的进展。我公司创始人兼CTO、上海交通大学生命科学技术学院的杨广宇教授团队,与上海交通大学自然科学研究院的洪亮教授团队紧密合作,利用Pro-PRIME蛋白语言大模型和有效的模型定向调优,在仅经过两轮设计后,实现了蛋白质稳定性的显著提高,并成功获得了100%的复合突变增益。
概述
优化酶的热稳定性在蛋白质科学和医疗应用中扮演着至关重要的角色。目前,利用(半)理性设计和随机诱变方法,可以有效设计多个增强酶热稳定性的单点突变。然而,在组合多个突变时,复杂的上位效应往往导致组合突变体失活。因此,优化酶通常需要多轮设计,这一过程非常耗时。最近,杨广宇教授的研究小组在《mLife》期刊上发表了题为“Optimizingenzymethermostabilitybycombiningmultiplemutationsusingproteinlanguagemodel”的文章,提出了一种前沿的AI辅助酶热稳定性工程策略,能够高效组合多个有益的单点突变。在肌酸酶的研究案例中,通过两轮设计,成功获得了50个具有优良热稳定性的组合突变体,成功率达到100%。
主要内容
在这一研究中,作者采用了一种AI辅助的酶热稳定性工程策略,利用有限的实验数据微调Pro-PRIME模型,以准确预测组合突变体的稳定性和活性。Pro-PRIME模型模型以9600万种宿主细菌的最佳生长温度数据为基础,展示出在高温酶设计与优化方面的卓越性能。微调过程中,所使用的初始数据集来源于肌酸酶的73个低阶突变体,涵盖了序列-热稳定性和活性数据。经过微调后,模型得以预测来自18个单点突变体的所有可能突变体的热稳定性和活性,旨在保持至少60%的相对活性,同时增强突变体的热稳定性。
整个过程包含四个步骤:(1) 数据收集,(2) 蛋白质语言模型微调,(3) 在突变序列空间中预测所有突变体,(4) 验证所选突变体。为提升预测精度,研究人员还将初轮预测的实验数据反馈至数据集中,并进行了第二轮微调和选择,最终在短短两周内设计出50个组合突变体,成功率高达100%。
研究中发现,最佳突变体13M4即使相比野生型仍保持几乎相同的活性,其Tm值提高了1019°C,58°C下的半衰期增加了约655倍。这一过程中,数据的反复利用和高质量实验结果显著提升了模型的预测性能,为未来的高阶组合突变体的适应性预测奠定了基础。
主要亮点
环亚集团·AG88提出的AI辅助酶热稳定性工程策略,能够高效组合多个有益单点突变,取得100%的设计成功率。最佳突变体13M4的Tm提升显著,极大地增强了生物医疗应用的有效性。通过高质量实验数据的微调,该研究展现了复合突变体的上位效应,并通过动态相关矩阵分析揭示了长程上位效应的机制,提供了宝贵的参考,未来将广泛适用于各类关键酶的进化任务中。本研究强调,将来自蛋白质工程的实验数据与先进的AI模型相结合,能够进一步提升模型预测性能,从而显著提高 protein engineering 的效率。这一策略将为生物医疗领域的创新应用开辟新的方向。