左侧是一个环形排列,显示了20种基本氨基酸(Amino Acids)的名称: 包括甘氨酸(Glycine) 谷氨酸(Glutamic acid) 谷氨酰胺(Glutamine) 半胱氨酸(Cysteine) 天冬氨酸(Aspartic acid) 等等...
右侧展示了从氨基酸到蛋白质的形成过程: 氨基酸首先以"串珠子"的方式连接成一条链(STRING OF AMINO ACIDS)
这条氨基酸链最终会折叠成特定的三维结构,形成功能性蛋白质(PROTEIN)
如何利用这20种氨基酸设计新的蛋白质(David Baker的工作) 如何预测氨基酸链最终会折叠成什么样的三维结构(Hassabis和Jumper的AlphaFold2的工作)
数据录入和数据库搜索
将一个结构未知的氨基酸序列输入 AlphaFold2 系统会搜索数据库中类似的氨基酸序列和蛋白质结构
序列分析
AI模型会对比所有相似的氨基酸序列(通常来自不同物种) 研究在进化过程中哪些部分被保留下来 AlphaFold2 探索氨基酸在三维蛋白质结构中如何相互作用: 带电荷的氨基酸会相互吸引 疏水性氨基酸会聚集在一起 生成一个距离图,估计氨基酸之间在结构中的距离
AI分析
使用迭代过程,AlphaFold2 不断完善序列分析和距离图 AI模型使用称为转换器(transformers)的神经网络 这些网络能够识别重要元素并利用第一步获得的其他蛋白质数据
假设结构生成
AlphaFold2 将所有氨基酸拼接成一个整体 通过三个循环周期测试不同的路径 最终得出一个特定结构 AI模型计算这个结构不同部分与实际情况相符的概率
序列分析中的共同进化模式 距离图显示氨基酸之间的空间关系 神经网络的示意图 多个循环周期如何逐步完善最终结构
全新设计
这是第一个完全从头设计(de novo design)的蛋白质结构 不是基于任何现有自然蛋白质的修改或模仿 David Baker团队在2003年设计了这个结构,开创了人工蛋白质设计的新纪元
结构特点
它包含了新颖的α螺旋和β折叠的组合方式 这种排列在自然界中从未被发现过 虽然使用了常见的二级结构元素(α螺旋和β折叠),但它们的三维空间排布是全新的
突破意义
证明了我们可以设计出自然界中不存在的蛋白质结构 表明蛋白质设计不必局限于模仿自然蛋白质 开启了人工蛋白质设计的无限可能性
方法学意义
验证了计算机辅助蛋白质设计的可行性 为后续更复杂的蛋白质设计奠定了基础 建立了从理论设计到实际合成的完整工作流程
展示了一个可以自发连接多达120个蛋白质的复杂结构 图中显示为一个大型球状结构,由紫色和浅绿色的蛋白质单元组成
设计出能够结合芬太尼(一种阿片类药物)的蛋白质 图中绿色为蛋白质主体,紫色部分为结合芬太尼的区域 这种蛋白质可用于环境中的芬太尼检测
黄色核心部分是纳米颗粒 绿色外层是模仿流感病毒表面的蛋白质 在动物模型中已经证明可以作为流感疫苗使用
设计出可以作为分子马达运转的蛋白质 图中显示为绿色的复杂结构
设计出具有特定几何形状的蛋白质 这些蛋白质可以根据外部影响改变形状 可用于制造微型传感器
图中显示为绿色环状结构 这是人体细胞中的一个巨大分子结构的一部分 超过一千个蛋白质共同组成了一个穿过细胞核膜的孔道 这个核孔对细胞核和细胞质之间的物质交换至关重要
图中显示为绿色的单个蛋白质结构 这种天然酶能够分解塑料 研究这种酶的结构目的是设计出可用于塑料回收的人工蛋白质 这对解决全球塑料污染问题具有重要意义
图中显示为一个复杂的多彩结构,包含多个不同颜色的蛋白质亚基 这是一种会导致细菌产生抗生素耐药性的酶 了解这种酶的结构对于寻找预防抗生素耐药性的方法非常重要 这对解决全球公共卫生面临的抗生素耐药性威胁具有重要意义