本报讯(记者王敏 通讯员聂诗琦)近日,中国科学技术大学教授刘淇与美国哈佛大学教授Marinka Zitnik 课题组合作,设计出一种深度生成算法PocketGen,用于生成与小分子结合的蛋白质口袋序列和空间结构。相关研究成果发表于《自然-机器智能》。
蛋白质口袋是蛋白质上适合与特定分子结合的空腔,每个蛋白质口袋都是一个特定的结合点位。当小分子与之紧密结合后,会引起蛋白质的构象变化,进而激活或者调节蛋白质功能。要想设计蛋白质口袋,传统方法是能量优化和模板匹配,但该方法计算效率慢、成功率低。现有的基于深度学习的模型又并非专为研究蛋白质-小分子相互作用而设计,可能无法充分描述蛋白质与小分子结合口袋区域之间的特征。
PocketGen则为上述问题的解决提供了新方案。该算法由双层图Transformer编码器和蛋白质预训练语言模型两部分组成。两者分别对应蛋白质的结构信息和序列信息。通过两个部分同时进行信息处理和不断迭代,该算法最终生成所需要的蛋白质口袋。
不仅如此,PocketGen在计算效率和蛋白质口袋设计的成功率方面表现亮眼,是目前全球最高效、具有最高成功率的蛋白质口袋设计算法之一。在实验中,PocketGen模型不仅在亲和力和结构合理性等指标上超过传统方法,计算效率方面也大幅提高——相比传统方法提高10倍以上。
据悉,PocketGen推进了深度生成模型用于功能蛋白质设计,为进一步理解蛋白质设计规律并开展生物实验验证奠定了基础,未来将在药物开发、生物传感器、酶催化等领域具有广阔的应用前景。
相关论文信息:https://doi.org/10.1038/s42256-024-00920-9