蛋白质设计师David Baker:我喜欢做那些“魔法”般的事

刚拿到2024年诺贝尔化学奖的David Baker教授可谓是蛋白质设计领域的“引领者”。他曾在2019年接受NSR的专访,介绍了蛋白质设计这个快速发展的研究领域,并分享了他自己的科学故事。

撰文 | 赵维杰(NSR新闻编辑)、王初(北京大学化学与分子工程学院教授)

在谷歌上搜索“de novo protein design”(蛋白质从头设计),点开第一页搜索结果中的任意一条,你几乎都能看到David Baker的名字。华盛顿大学蛋白质设计研究所所长David Baker与他的同事们一起,创造了一个由各种各样全新且有趣的蛋白质组成的新世界。

蛋白质是生命活动的直接执行者,其结构与功能由氨基酸一级序列所决定。由Baker研究组开发的Rosetta软件包可以对蛋白质结构进行计算预测与设计。能够从零开始设计蛋白质结构和功能,意味着我们可以创造出具有各种功能的全新的生命活动执行者,并将其应用于生物医学研究的方方面面。

2019年11月,David Baker教授在北京接受NSR的专访,介绍了蛋白质设计这个快速发展的研究领域,并分享了他自己的科学故事。

图片

华盛顿大学教授David Baker,蛋白质设计领域的“引领者”

设计蛋白质,为什么?怎么做?

NSR:您在很多场合提到过“蛋白质设计革命”(protein-design revolution)。这场革命的目标是什么?

Baker:这场革命与人类历史上发生过的其它科技革命类似,我们将可以用新的方式来操控世界。学会控制金属,让人类走出了石器时代;在工业革命中,人们学会了用蒸汽机来操控机器;在这之后,数字革命又让我们能够在计算机中存储信息。现在,通过“蛋白质设计革命”,我们将学会用前所未有的方式,来操控生物分子。

NSR:所以说,我们将可以用蛋白质来制造工具?

Baker:没错。我们将可以用蛋白质来制造很多东西。比如,我们可以制造出新的药物、疫苗、疾病疗法,甚至是新的材料。

NSR:蛋白质设计和蛋白质结构预测都依赖于基本的蛋白质折叠法则。对于这些法则,我们已经完全掌握了吗?

Baker:我们掌握了这些法则的基本框架,但还没有掌握所有的细节。我们知道,蛋白质通常会折叠到能量最低的状态。我们也知道如何去计算它的能量。这种计算已经比较准确,但还没有准确到,能够精确反应每一种蛋白质功能的程度。

在未来,一定还会有理论上的发展,也会从实验中获得更多的信息反馈。将这些进展综合在一起,我们将可以更好地在原子层面描述蛋白质的能量信息。

NSR:现在,在您的实验室中,要设计一种具有特定功能的新的蛋白质,通常的步骤是怎样的?

Baker:这取决于你想要实现的“特定功能”是什么。比如说,如果你想设计一个能够与某个癌细胞靶点结合的蛋白质,你需要首先确定二者的结合面,要做到这一点,你需要对这个靶点的结构和功能有所了解。之后,你可以设计出这个蛋白质的大致形状,这个形状应当能与靶蛋白互补;然后,再去设计结合面上的氨基酸序列,让二者在几何形状和化学上都能相互匹配。

这之后,你要去检查这个设计出的新序列,确认你所需要的结构是不是这个序列所能折叠成的能量最低的结构。上面这些步骤,基本上都是在计算机上自动完成的。

然后,你就可以去合成出编码这个新结构的基因,将它在细菌细胞中表达,然后纯化出这个蛋白,看它能不能与靶蛋白结合。最近,我们发展了一种方法,可以并行地同时检测几万种设计产物,从中挑选出能够与靶蛋白结合的那些蛋白设计。

NSR:如果我们让两个人去设计同一个蛋白质,他们会获得相同的结果吗?

Baker:设计中的可能性空间是非常大的。在我们的算法中有随机的部分,计算机会做出一些随机的选择。所以,即便是同一个人将同样的程序运行两次,得到的结果也很可能不会完全相同。

NSR:设计一个蛋白质需要多长时间?

Baker:在计算机上完成一次设计所需的时间并不长。通常,你会得到不只一种设计结果,而是几十万个。之后,你需要用各种参数和标准去评价这些结果,从中找出最有希望的,再去进行实验验证。

真正费时的是之后的工作。要完成一套实验验证需要4到6个星期。拿到实验结果之后,你通常还需要回过头来,基于这些结果再去改进你的设计。这样的设计循环不只一轮,反复的迭代需要很长时间。

在这个不断重复的过程中,我们也在不断学习如何做出更好的设计。所以说,在科学与工程之间,我们的工作更偏向于科学。

NSR:设计的成功率怎样?

Baker:我们要解决的问题不同,设计的成功率也不同。成功率也是一个时间的函数。通常,如果我们选择了一个新的问题,成功率会相对较低。而如果我们已经对这个问题有了很多的了解,成功率就会高很多。

图片

Baker的实验室(图源:Baker实验室网站)

神奇蛋白在哪里?

NSR:你设计的很多蛋白质都是以α螺旋为主的。为什么?

Baker:我想,我们从α螺旋开始的原因是,稳定α螺旋所需要的相互作用,是发生在序列上比较接近的氨基酸之间的。与之相比,要计算出β折叠片之间是怎样结合在一起,从而形成β折叠的,则要更加复杂。

但是现在,我们对于β折叠型蛋白质的理解已经进步了很多,这已经不再是一个难题了。我们现在已经可以程序化地设计出只由β折叠构成的蛋白质。比如,我们设计过一些β桶型蛋白质,它们位于生物膜上,可以转运离子。

NSR:你们设计过一个只能选择性通过钾离子的β桶。这种选择性是你们有意设计的吗?

Baker:不是。我们当时只是设计了一组孔径不同的蛋白质,没有想到其中之一会具有钾离子选择性。对于钾离子通道的运行原理,人们一直有不同的看法,而我们的结果显示,也许只不过是因为通道的孔径刚好合适,刚好有利于钾离子脱去表面的水分子。所以,这也是一个很好的例子,说明蛋白质设计可以帮助我们更好地理解天然蛋白质的工作方式。

NSR:你们还设计过一个蛋白质转子,它是由两个单独设计的蛋白质组件组装而成的。所以,模块化是蛋白质设计的发展方向吗?

Baker:没错。在蛋白质从头设计中,我们正在构建一组通用的结构组件,它们之间可以按照不同的方式进行简单的组装。

NSR:DNA/RNA设计也在快速发展。蛋白质设计会与DNA、RNA或者其他材料的设计结合起来吗?

Baker:是的,将蛋白质设计与DNA折纸相结合,会是一个很有趣的方向。我们也在设计能与无机材料相结合的蛋白质。比如,我们正在尝试用蛋白质来调控无机晶体的生长。这也许可以应用于半导体制造等领域。

NSR:你们的设计已经有产业应用了吗?

Baker:有。我们创建了几家公司,来推动蛋白质设计的产业化。有一家名叫Neoleukin Therapeutics的公司,尝试将一种人工设计的类似于白介素-2的蛋白质,应用于癌症治疗。我们还有另一家公司,在设计针对多种病毒的疫苗。

NSR:你目前在设计哪些蛋白质?

Baker:我们有好几个有趣的方向。我们在设计跨膜通道,这可能应用于过滤,或者DNA纳米孔测序。我们也在设计各种分子机器、新型的药物分子,以及各种材料。此外,我们还希望设计出能够调控细胞生长、分化、命运决定等各种细胞行为的蛋白质。

NSR:对于很多人来说,你实验室的工作就像魔法一样。

Baker:有时候我自己也会觉得这像是魔法。我喜欢做这些魔法般的事情。但是我需要说明,这并不是我们工作的全部。我们总是向大家展示那些成功的、魔法一样的设计,但是很少谈起复杂的设计过程,以及那些没有成功的故事。

在你的笔记本电脑上,折叠蛋白!

NSR:你是怎么想到去做Foldit(一个关于蛋白质折叠和设计的在线解谜游戏)的?

Baker:我们开始做蛋白质结构预测的时候,发现这项工作需要很多计算机。我们不停地购买新的计算机,花钱很多,而且很快就没有空间放置它们了。所以,我们启动了一个叫做Rosetta@home的项目,邀请世界各地的人们用他们自己的计算机来帮助我们进行计算。这是一个屏幕保护程序,计算机在进行计算的时候,屏幕上会显示出正在折叠的蛋白质。

很快,我们就开始收到使用者的来信,他们说,他们认为计算机折叠得不够好,如果他们自己动手的话,可以做得更好。所以,有一天,我和我女儿的朋友的父亲一起去徒步登山,他是一名计算机科学家,我们谈起了这件事,并且想到,可以从Rosetta@home出发,做一个游戏。这就是Foldit的前身。

NSR:Foldit现在的运行情况如何?未来还会怎样发展?

Baker:它运行得很好。我们的注册玩家很多,同一时间在线的玩家会有大约几百人。由Foldit玩家设计出的蛋白质,还曾经发表在Nature上。

Foldit创建的时候,是做蛋白质结构预测的,但是现在已经转向了蛋白质设计。我们会不断为玩家更新关卡。随着我们研究兴趣的改变,它也会不断变化。

建立蛋白质设计的学术群体

NSR:除了您的研究组之外,还有其他的蛋白质设计研究团队吗?

Baker:有很多实验室都在做蛋白质设计。不同的实验室有不同的兴趣和方向。我自己对蛋白质从头设计非常感兴趣。但是实际上,如果你想解决一个特定的应用问题,改造一个已经存在的蛋白质,可能是比从零开始设计一个蛋白质更好的选择。

NSR:您培养的学生已经遍及世界各地。

Baker:很多做蛋白质设计的科学家都曾经在我的实验室工作过。我们创建了一个学术团体,叫做Rosetta Commons,很多高校和研究机构都已经是它的成员。在这个团体中,许多研究团队相互交流、合作,不断改进Rosetta软件,取得了非常丰硕的成果。

现在,有很多公司都在使用Rosetta,它们需要每年缴纳一定的费用。但是我从最初就决定,没有任何人可以从Rosetta中获取个人利益。所以,这些收入,每年超过100万美元的收入,都被投入于Rosetta Commons的各种活动。

我们每年举办一次RosettaCon会议。大家都会回来,介绍自己最近的成果,共同讨论如何发展Rosetta。现在,这已经是一个非常大规模的国际合作工程,我们也计划从2019年起,将会议改为每年两次。

我们还利用这些经费开办训练营,帮助那些对Rosetta感兴趣但是还不知道如何使用它的人。这些新鲜血液的工作对于Rosetta团体来说非常重要。能和所有人一起工作,真的是太棒了。

图片

2020年的RosettaCon将在线上进行

Baker的故事

NSR:您是如何开始用计算机进行生物学研究的?

Baker:我在研究生期间的工作完全是实验性的。我很想学习一些新东西,而在我开始做博后的第一天,我的桌子上就摆着一台计算机。我需要用它做一些关于晶体结构优化的工作。

我的博士后实验室是一个结构生物学实验室。那里专门有一间解析晶体结构的屋子,所有人都坐在计算机终端前面,将氨基酸链匹配到电子密度图里面去。我坐下来,试着做了3分钟,感到头痛欲裂。这让我意识到,我做不来这样的事,我想要用计算机去做一些其他的事情。

NSR:你是什么时候开始做蛋白质结构预测的?在申请华盛顿大学教职的时候,你把它写进申请书了吗?

Baker:没有,我申请书的内容基本上还是实验性的。但是我已经对蛋白质折叠感兴趣很久了,我建议我的第二个学生去做蛋白质结构预测。我通常会告诉别人,应该专注。但是那时候,我却让他去做了这么一件完全不同的事情。我也不知道这是为什么。

NSR:在刚开始研究蛋白质折叠的时候,你有怎样的目标?是否想到有一天,你可以从零开始设计蛋白质?

Baker:我没有任何预期。事实上,我会对从现在开始6个月之内的事情有所计划,但不会做长期的规划。如果能够计划,那就不是科学了。你总是希望,能够做出自己从未想象过的发现。

NSR:据说,您现在还有自己的课题,还在自己做科研。

Baker:前几个月我都比较忙。但是没错,我还在做自己的课题,也会在组会上展示我自己的工作。在大型会议上做报告的时候,我一点都不紧张,因为我知道在接下来的很长时间里,我都不会再遇见这些听众。但是,要在组会上做报告的时候,我真的会非常紧张,因为下面坐着的是每天和我一起工作的、这个领域中真正的专家。

NSR:这一点非常可贵。大部分著名的科学家都不会这样做。

Baker:其实,我是从孩子们上大学离开家,我有了更多时间之后,才开始这样做的。我自己去做的工作,一定要是完全新颖的工作。有一次,在RosettaCon会议上,我一直在谈α螺旋束型的蛋白。当时所有人都听烦了,但是在两年之后,我却看到,有好多人都在做这种蛋白。

NSR:您对年轻人有什么建议?如何像你一样充满创造力,并且发表这么多顶刊论文?

Baker:我认为最重要的,是去选择最关键、最有挑战性的课题。你可以选择去做一个完全没有人做过的课题,也可以选择一个许多人都在做的方向。但是,无论你选择哪一个,要做出结果都是困难的;无论如何,总要许多时间和努力才能完成。所以,不要去担心课题是否安全。选择重大的科学问题、享受你的工作,就好了。而一旦你解决了这些问题,你就自然地推动了科学的进步,也自然会有好的文章。

本文是National Science Review 访谈文章“Protein designer David Baker: I like doing things that seem like magic”的中文版本,转载自微信公众号“国家科学评论”

英文原文链接:
https://doi.org/10.1093/nsr/nwaa071

图片