西湖大学团队利用大数据分析和基因挖掘,绘制世界首张芳香型聚酮全景图,张骊駻:阐明大自然的规律是我更想做的事

图片
兴趣是最好的老师,这句话是西湖大学张骊駻在选择科研方向时所遵循的原则。
张骊駻自幼随父母在日本生活,在日本完成了从小学到大学的学习生涯,并在东京大学开启了药物研究之路。在接触了有机合成和生物学研究等科研方向后,他最终选择了天然产物相关研究。
“天然产物是大自然创造的药物分子,了解天然产物可以探索大自然的奥秘,利用合成生物学技术则可以生物合成天然产物,创造很多复杂的分子。”
在东京大学读完博士的张骊駻继续深入学习,拓展自己的研究。2017 年,他开始在美国哈佛大学化学系Emily Balskus教授组从事博士后研究,在此期间,学习了如何从基因大数据角度挖掘酶和化合物,也是在这里接触到了聚酮类化合物。
2019 年,张骊駻来到西湖大学任教,正式开始研究聚酮类化合物的生物合成。目前该团队主要以生物信息学大数据分析和基因挖掘为基础,研究天然产物的生物合成、药物发现、以及组合生物合成和合成生物学在医学和工业中的应用。
近日,张骊駻团队在探究细菌来源的芳香型聚酮化合物的进化过程及其结构多样性上取得了巨大突破,该团队通过基因大数据分析,揭示了细菌来源芳香聚酮的全景图,并参考利用这一宏观地图成功获得了结构新颖的芳香聚酮化合物,极大地提高了对最终合成的化合物预测的精准度。
借此机会,生辉 SynBio 邀请到了张骊駻来与我们分享他的研究成果和科研经验。
图片
图丨张骊駻(来源:受访者)
绘制世界首张芳香型聚酮全景图
芳香型聚酮化合物是药物发现的重要来源。以阿霉素、四环素为代表,细菌来源的芳香型聚酮化合物主要由二型聚酮合酶合成。利用生物合成关键酶的基因挖掘策略可提高芳香型聚酮的发现效率。虽然快速累积的基因组测序和基因挖掘方法提供了新天然产物发现的有效手段,但其合成 “生产线” 特殊、由多个酶协调合成,“预测” 难度非常大。基于团队的前期研究与资料分析,张骊駻认为,芳香型聚酮分子生物合成过程中,CLF(链长因子)酶发挥了关键作用。每个聚酮分子都需要该酶,并且不同类型聚酮分子的 CLF 酶,其氨基酸序列不同。
在前人研究的基础下,当前已存在 167 个已被研究过(即已表征)、已知晓天然产物对应关系的基因簇(即细菌菌株中编码生物合成酶的一列或几类基因)。因此,张骊駻团队从这 167 个基因簇入手,通过分析发现,这些基因簇中 CLF 蛋白的氨基酸序列的信息特征正好对应不同化合物的结构特征。
以 CLF 酶为介质,张骊駻团队得出了一个可决定该基因簇是否能产生不同化合物的计算方法及数值线 -88%。通过比较两个 CLF 的氨基酸序列,发现 88% 以上的相似度就可产生相同的合成产物;低于 88% 则会产生不同化合物,由此预测了最终化合物的 “唯一性”。
图片
图丨芳香聚酮天然产物的全球蓝图以及新分子发现示意图(来源:Angew. Chem.)
为了进一步验证,张骊駻团队从公共基因组数据库中提取了 3254 个细菌来源的芳香型聚酮化合物的生物合成酶的数据,这些数据均源自先前已被测序的全球所有的微生物。运用上述方法,该团队构建出了描述 “酶氨基酸序列 - 化合物结构”“对应关系的全球”“系统发育树”,并将细菌菌株信息纳入图表(即图表上最外圈的圆环),又得到了菌株与化合物之间的对应关系。
图片
图丨细菌来源芳香型聚酮天然产物的全景图(来源:Angew. Chem.)
最后,张骊駻团队通过这张全景图筛选出了 7 种菌株,然后在这 7 种菌株种锁定了两种可产生新型聚酮化合物的细菌,并在菌株发酵后产生的最终产物里鉴定出了新型的芳香聚酮分子,包括从一株罕见嗜酸放线菌中分离得到了带有新颖骨架的萘吡喃类化合物 oryzanaphthopyran。这些发现进一步佐证了本研究所取得的全景图在这类天然产物研究中的实际价值。
图片
图丨新颖芳香聚酮分子 oryzanaphthopyran 的发现(来源:Angew. Chem.)
张骊駻表示,整个研究过程中,最难的工作是如何将进化或基因信息变成化学信息。如已知一个新的序列,如何将它与聚酮化合物进行对应,需要更深入的分析分子的结构。通过这张全景图,一方面可以了解进化的过程,以利用人工加速和进化创造更多的聚酮分子;另一方面了解资源的分布,虽然已经发现了不少芳香聚酮分子,但还有很多没被发现。
以 “生产线” 方式进行生物合成
“除了探索大自然的运转规律,我们实验室还想了解大自然创造天然产物的机理。只有明确知道大自然创造天然产物的机理,才能应用理论创造更多的产物。” 在这方面,张骊駻团队主要进行生物合成酶包括聚酮合成酶和多肽合成酶的研究,并以 “生产线” 的方式利用酶进行生物合成。
以 “生产线” 方式生物合成的优势在于它具有模块性,各个模块发挥其具有的作用,并将其传达给下个模块,以此类推,类似于流水线。理论上,只要设计好排序,可生成任何目标产物。不过此方法也存在材料有限的问题,有的材料较为基础像聚酮和多肽氨基酸的起始单元,因此物质较易生成。“其实有限的组合也可生成无限的物质,只是目前缺少将其高效重组的方法学。”张骊駻实验室目前正研究如何重构这些模块,使其保持活性,并让其产生新的物质。
张骊駻也透露,该工作也存在生产线的酶改造等难点。酶可比喻成 “乐高积木块”,我们需要将这些 “乐高积木块” 组合,就像搭积木,将积木块累积起来,最终构成一定的形状。但这个自由度较大,且取决于酶的个数和兼容性问题。事实上,如果将其线路切断,再连起来酶将会失活,且目前相关改造没有理论背景,仍处于尝试阶段。
他补充道,不过还是取决于最终目标。若最终目标结构较简单,则对酶的要求不高;但若结构较复杂,如在分子末端加一个氨基或炔基,则需要特殊的酶。但这个酶微生物本身并不一定能合成,需要对其基因改造和编辑,或导入其他的途径,才可产生该酶,再将其组装在 “生产线” 上产生目标产品。
张骊駻实验室现阶段的课题仍处于基础研究,目前只有两个 “乐高积木块”,他计划先理清这两个 “乐高积木块” 连接的方向和角度,以解决更多问题。最终目标是提供较为通用的搭建 “乐高积木块” 的理论底盘。这也是他选择入职西湖大学理学院化学系的原因。
科研的最终目标是为应用服务,但我的直接目标并不是应用,我更想做的事情是阐明大自然的规律,为根本性的问题提供答案。而这可为合成生物学发展提供很好的基础和材料,有了这些理论,才能做更多的事情。后续也希望能有更多的合作,用实际的例子证明我们的技术确实能达到这样的用途。”
参考文献: