

还在为蛋白质结构解析的精度问题头疼吗?传统方法在低分辨率下总是差强人意,氢键、π-堆积等关键相互作用难以准确描述?别担心,AI量子精修技术来了!
最近,卡内基梅隆大学、波兰弗罗茨瓦夫大学、佛罗里达大学等高校的联合研究团队,带来了一项颠覆性的技术突破——AQuaRef人工智能驱动的量子精修方法!
你知道吗?目前主流的蛋白质结构精修软件,如CCP4和Phenix,主要依赖标准数据库中的立体化学约束!
这些约束虽然能维持合理的键长、键角,但存在明显局限:
而理论上,量子力学方法能够更准确地描述分子间相互作用!但问题来了——生物大分子通常包含数千甚至上万原子,全量子计算成本极高!
这就是AQuaRef诞生的背景!
AQuaRef基于AIMNet2机器学习原子势函数,专门针对精修任务进行了定制训练!
最厉害的是:在接近经典力场计算效率的同时,能够较好地逼近量子力学计算结果!
这意味着什么?意味着我们终于可以在可接受的计算成本下,对生物大分子进行全原子量子精修了!
这项研究成果已经发表在Nature Communications上,标题就是「AQuaRef: machine learning accelerated quantum refinement of protein structures」!
来看看AQuaRef的惊人表现:
为了构建强大的机器学习势函数,研究团队创建了包含100万样本的数据集!
这个数据集系统覆盖了三个关键维度:
更厉害的是,团队采用了query-by-committee的主动学习策略!通过四轮迭代,不断筛选高不确定性样本进行DFT计算,最终构建出高质量的训练集!
在计算效率方面,AIMNet2框架的表现令人惊艳:
这意味着什么?意味着大规模蛋白质结构的量子精修终于变得可行了!
研究团队构建了包含41个冷冻电镜模型、20个低分辨率和10个超高分辨率X射线模型的测试集!
结果如何?量子精修后的低分辨率模型在几何指标上明显优于传统约束方法!
更令人兴奋的是:模型与实验数据的拟合程度基本保持一致,过拟合程度还有所降低!
在部分案例中,标准约束与量子精修所得结构的局部差异可达2Å!
研究团队将AQuaRef与多种主流精修方法进行了全面比较:
总体来看,AQuaRef的Rfree略优,且过拟合程度最低!在几何质量方面,AQuaRef与Rosetta表现接近,明显优于其他方法!
在帕金森病相关蛋白DJ-1及其同源蛋白YajL的测试中,AQuaRef展现了惊人的精准度!
传统精修方法受数据库立体化学约束影响,往往会使键长偏离真实值!但AQuaRef无需人工干预,就能自动确定与实验证据一致的质子位置!
即使在实验数据被截断至2Å分辨率、原子细节明显减少时,AQuaRef仍能恢复与原始1.15Å数据几乎一致的结构!
蛋白质量子精修领域正在迎来产学研的全面突破!
牛津大学团队开发的神经网络方法nn-tm fcc,能够以接近全量子力学精度构建高精度残基片段势能面模型!
德国合作团队提出的BF-DCQO量子算法,通过非变分迭代策略,将包含12个氨基酸的三维折叠问题计算时间从72小时压缩至约4.3分钟!
速度提升达到千倍量级!
量子力学方法、机器学习势函数与实验结构数据的结合,正在为生物大分子结构精修提供全新的技术路径!
这项技术有望在多个场景中发挥重要作用:
金句:当AI遇见量子,蛋白质结构的每一个原子都找到了最合理的位置!
你觉得这项技术会对未来的药物研发产生怎样的影响?欢迎在评论区分享你的看法!
如果觉得这篇文章对你有帮助,别忘了点赞和分享给更多对AI和生物技术感兴趣的朋友!