2024年诺贝尔化学奖:蛋白质设计与结构预测革新生物学范式

文章转载自化学人生 

2024年10月9日,诺贝尔化学奖揭晓。美国科学家大卫·贝克(David Baker)因其在蛋白质结构设计领域的开创性贡献获得一半奖金;另一半则共同授予英国科学家德米斯·哈萨比斯(Demis Hassabis)和美国科学家约翰·江珀(John Jumper),以表彰他们在蛋白质结构预测方面的贡献。

图片

David Baker, Demis Hassabis和John Jumper(从左至右)因开发可被用于预测和设计蛋白质结构的计算工具被授予诺贝尔化学奖。来源: BBVA Foundation


2024年的诺贝尔奖陆续公布,多个奖项与人工智能研究相关,这一现象凸显了人工智能发展与科学研究之间紧密且重要的关系。

随着人工智能技术的发展,人工智能越来越多地融入科研活动中。从收集整理数据到设计实验,善于借助人工智能的研究者获得了前所未有的效率及洞察力。

今年的诺贝尔化学奖,就与人工智能有关。戴米斯·哈萨比斯和约翰·詹珀成功地利用人工智能技术预测了几乎所有已知蛋白质的结构。而大卫·贝克掌握了生命的构建模块,并创造了全新的蛋白质。


01

蛋白质“从头设计”的挑战与突破


蛋白质在生命体中发挥着核心作用,其三维结构决定了生物学功能。过去50多年,生物医学研究聚焦于理解蛋白质如何折叠并发挥作用,这推动了蛋白质分子设计学科的诞生。

该领域通过预测氨基酸序列折叠、改造天然蛋白质、拼接不同蛋白结构域或“从头设计”全新蛋白质,旨在创造出性能优越的新型蛋白质,用于催化特定反应、医药和材料科学。尽管完全从头设计蛋白质面临重大挑战,被视为世界级难题,但David Baker团队等科学家正逐渐突破这一壁垒。

蛋白质的多样性和高效性源于20种氨基酸的不同排列组合。科学家探索通过功能设计蛋白质结构,再用逆向算法推导回序列的“从头设计”方法。

2003年,David Baker团队首次设计出非自然界的全新蛋白质Top7,标志着从头设计蛋白领域的重大突破,但Top7仅具结构无功能。蛋白质的复杂性和与生物体内其他分子的相互作用使设计具备特定功能的蛋白质极具挑战。随着生成式AI和其他机器学习技术的发展,Baker团队在2024年成功设计出能调控成纤维细胞生长因子信号通路并促进血管分化的全新环形蛋白,这大大扩展了蛋白质从头设计的应用前景,对领域发展产生深远影响。


02

蛋白质的结构预测


2016年,韩国围棋选手李世石与 AlphaGo 的“世纪人机大战”中, AlphaGo 获胜,其背后的DeepMind 公司及其创始人 Demis Hassabis 因此受到全球关注。Hassabis 意识到DeepMind 的技术已准备好应对生物学中的重大挑战——预测蛋白质结构。他组建跨学科团队,致力于将 AlphaGo 的技术应用于解决蛋白质折叠问题。

2018年,DeepMind推出AlphaFold ,在“蛋白质结构预测奥运会”CASP比赛中表现出色。经过不断迭代,AlphaFold 2 的预测精度与实验室模型相当,甚至更高,成功预测了几乎整个人类蛋白质结构。

 Hassabis 多年来一直对蛋白质问题充满兴趣,AlphaFold 的成功实现了他破解蛋白质折叠的梦想,也为生物学研究带来了变革。AlphaFold 使用了国际蛋白质数据库中的大数据作为基础其成功预测蛋白质结构的能力为生物学家提供了前所未有的工具,有助于加速生物学研究和药物开发等领域的发展。

约翰•詹珀(John M. Jumper)在蛋白质结构预测领域的贡献显著而深远。作为DeepMind团队的关键成员,他积极参与了AlphaFold 项目的研发,在和其他科学家的精湛技术和创新思维下,AlphaFold 应运而生。

约翰的贡献不仅在于AlphaFold 的成功开发,更在于他推动了人工智能技术在生物学研究中的应用,为生物学研究带来了革命性的变化。他深知蛋白质结构预测对于理解生命过程、推动药物研发的重要性。

随着AlphaFold 等技术的不断发展,我们有理由相信,未来的生物学研究将更加高效、精准,为人类健康事业作出更大的贡献。

图片


03

为什么是蛋白折叠?


作为支撑人体基本生命活动的物质,蛋白质由20种氨基酸呈念珠状连接形成三维形状,而形状本身决定了蛋白质的功能,所以研究蛋白质形状一直是医学领域的热门方向。

在 AlphaFold 出现之前,蛋白质形状的研究都需要通过实验来完成。并且,让蛋白质结晶是件非常困难的事情,有些蛋白质不能像膜蛋白那样结晶,必须使用昂贵的电子显微镜或X射线晶体分析仪,耗费数月、甚至几年,才能得到三维结构并将其结构可视化。无数博士都在研究单一蛋白质的折叠。

而 AlphaFold 2 能够直接从蛋白质的氨基酸序列中预测蛋白质的3D结构,并且达到原子级精度,被认为解决了困扰人类50年历史的蛋白质折叠挑战,迅速推进了人类对基本生物过程的理解,并促进药物设计。

2018年,DeepMind 官宣了旗下AlphaFold 。初亮相时,它在第13届“蛋白质结构预测奥运会”CASP比赛中,成功预测了43种蛋白质中25种蛋白质的最准确结构,力压其他97个参赛者。

图片

▲ DeepMind发布的一个蛋白质3D数字演示图

图片

▲ DeepMind model of a protein from the Legionnaire's disease bacteria (Casp-14)(军团病细菌(Casp-14)蛋白质的DeepMind模型)

基于初代版本,2020年,DeepMind又推出了AlphaFold 2。它能够在广泛领域进行蛋白质结构的预测,已经将两亿多蛋白的三维结构全部都预测出来,在结构生物学中是最重要的里程碑的贡献,对后续蛋白质结构及功能研究具有开创性意义。

该系统还在应用层面,特别是对生物制药的促进作用巨大。了解蛋白质的三维结构,对于设计针对性的药物分子也大有帮助。如今全球已有数百万研究人员将AlphaFold 2 应用在疟疾疫苗、癌症治疗和酶设计等领域,有了不少新的发现。之后的 AlphaFold-Multimer 则推动了对蛋白质-蛋白质复合物的预测。

2024年5月,由 Google DeepMind 和 Isomorphic Labs 研究团队推出的新一代AlphaFold—— AlphaFold 3 登上了 Nature

据介绍,AlphaFold 3 以前所未有的精确度成功预测了所有生命分子(蛋白质、DNA、RNA、配体等)的结构和相互作用。与现有的预测方法相比,AlphaFold 3 发现蛋白质与其他分子类型的相互作用至少提高了50%,对于一些重要的相互作用类别,预测准确率甚至提高了一倍。

研究团队认为,AlphaFold 3 可以将我们从蛋白质带入广泛的生物分子领域,这一飞跃有望开启更具变革性的科学——从开发生物可再生材料和更具抗逆性的作物,到加速药物设计和基因组学研究,进而开启人工智能细胞生物学的新时代。