超级细菌、AI黑盒与不老奥秘

图片
作者|苏霍伊
编辑|王博
“五一假期就是渡劫。”一位感染肺炎支原体的患儿家长在社交媒体上感叹。
从去年冬天到现在,“肺炎支原体”“阿奇霉素不管用了”几次登上热搜,“抗生素耐药性”这个专业名词更是结结实实扎进了许多患儿家长的心里,成为了他们被迫了解的词。
他们未曾料想,与感染性疾病的“抗争”,会如此揪心和漫长。
冬春之交,家住北方的白兰(化名)4岁的女儿开始反复发烧。焦虑了两个夜晚后,她将女儿送到了医院。午夜时分,长椅上、地上甚至是楼梯间里,或坐着或躺着的,都是额头上贴着退热贴的患儿和满脸担忧的家长。
而后白兰的女儿确诊为肺炎支原体感染。吃了3天阿奇霉素又静脉输液后,女儿的症状并未缓解,反而发展成了肺炎,“CT显示肺部已经变白了。”
“最初以为只是感冒,现在少说也要住院一周。”白兰告诉「甲子光年」。医生解释道,这可能与“儿童免疫力减弱和对大环内酯类抗生素(如:阿奇霉素)的耐药性增强等因素有关”。
抗生素耐药性是指细菌、病毒、真菌和寄生虫等微生物对原本能够抑制或杀死它们的抗生素或其他药物产生耐药性的现象。
尽管“支原体是否属于细菌”在学术界一直存在争议,但“阿奇霉素对肺炎支原体不太管用了”已是不争的事实。北京友谊医院呼吸内科主任医师林芳介绍,目前在我国流行的肺炎支原体对大环内酯类抗生素耐药率达60%—80%。北京朝阳医院感染和临床微生物科副主任医师尹玉东接受《新京报》采访时也表示:“我国是全球肺炎支原体对大环内酯耐药率最高的国家,在成人患者中这一比例达到60%—70%,儿童患者超过80%。耐药一直是影响支原体治疗效果的主要原因。”
事实上,抗生素耐药性造成的感染远比想象的严重。
2022年1月,国际顶尖医学期刊《柳叶刀》(The Lancet)发表了一项研究,数据显示,2019年全球有超过120万人死于抗生素耐药性感染,高于艾滋病毒(HIV)/艾滋病(AIDS)或疟疾造成的死亡人数。
除了合理使用现有抗生素外,开发新型抗生素是否能有效应对日益严重的耐药性问题?
“我们急需新型抗生素来对抗耐药微生物。但过去几十年,开发的新型抗生素寥寥无几,新出现的药物往往与现有的类似,未能实现根本性突破。”华裔科学家Felix Wong在接受「甲子光年」独家专访时说。
Felix Wong是美国麻省理工学院—哈佛大学布罗德研究所(Broad Institute of MIT and Harvard)詹姆斯·柯林斯(James J. Collins)实验室的博士后研究员,同时也是硅谷整合生物科学公司(Integrated Biosciences)联合创始人,他一直致力于AI制药领域。
据英国《抗生素耐药性研究》显示,预计2050年,全世界预计每年因抗生素耐药性死亡人数为1000万人。尽管抗生素需求巨大,但由于研发周期长、市场回报小等原因,制药公司基本上放弃了这一领域,转向了更有利可图的市场。
“我想改变这一切。”Felix Wong说。
2023年12月20日,Felix Wong以第一作者的身份在《Nature》上发表了论文《Discovery of a structural class of antibiotics with explainable deep learning(利用可解释深度学习发现一类抗生素结构)》。
图片
论文页面,图片来源:《Nature》
这也是60年来第一次用AI发现全新类别的抗生素。
为此Felix Wong测试了39312种化合物对金黄色葡萄球菌,以及肝脏癌细胞、肌肉细胞和肺细胞这3种人类细胞的影响。这些测试数据被用于训练可解释的深度学习模型,以预测化合物的抗菌活性和其对潜在的细胞毒性。
经过训练的模型从超过1200万种化合物中,识别出一类可以杀死耐甲氧西林金黄色葡萄球菌(MRSA)的化合物。这些化合物对人体细胞无毒,十分适合作为抗生素药物候选。
图片
左边培养皿中MRSA在没有抗生素的情况下不断滋生;右边培养皿中的MRSA在新型抗生素的作用下,基本全部被消灭
不仅如此,研究中的另一个创新之处在于——打开了深度学习模型的“黑盒”,明确了模型在预测抗生素效力时所依据的特定数据特征和信息。这种可解释性的人工智能也可以被应用于其他药物研发,乃至更广泛的科学领域。
死亡是人类最古老的困局。
但Felix Wong有一种执念,他想“征服衰老(conquer aging)”。尽管死亡是无法避免的,但至少可以如狄兰·托马斯的诗中所讲——不要温和地走进那个良夜。
1.狙击“超级细菌”
2019年底,Felix Wong所在的麻省理工学院Collins实验室启动了“抗生素-AI(Antibiotics-AI)”项目。
项目要求七年内开发七种新型抗生素,用于治疗世界上七种最为致命的细菌病原体——大肠杆菌、肺炎克雷伯菌、鲍曼不动杆菌、铜绿假单胞菌、淋病奈瑟菌、金黄色葡萄球菌和结核分枝杆菌,它们是未来30年可能对人类构成最大威胁的超级细菌。
“抗生素-AI”项目希望通过攻克这些细菌来预防数百万人的死亡。在大幅增加抗生素类别的同时,极大地提高新型抗生素开发的效率和增强对耐药性感染的治疗能力。
图片
合成生物学领域的先驱者詹姆斯·柯林斯,图片来源:HARVARD MAGAZINE
颇有一种“七剑下天山”的感觉。
Felix Wong瞄准的就是其中“最难缠”的耐药菌——耐甲氧西林金黄色葡萄球菌(MRSA,Methicillin-resistant Staphylococcus aureus)。
MRSA,在医疗领域是一个令人闻风丧胆的名字。
自1961年首次发现以来,MRSA就以顽固的抗药性著称。
它是金黄色葡萄球菌的一种独特菌株,MRSA感染与乙肝病毒感染、艾滋病病毒感染并列为世界三大最难根治的感染性疾病。它产生的青霉素酶,可以破坏包含β-内酰胺环的抗生素使其失效,让MRSA几乎对该类别下所有抗生素如甲氧西林、青霉素等表现出高度耐药性。
同时,它也是多种病症的“罪魁祸首”,例如肺炎、败血症、感染性心内膜炎等。
因此MRSA素有“超级细菌”之称。
而金黄色葡萄球菌(Staphylococcus aureus)在我们的生活环境中随处可见。
它常见于人的皮肤和黏膜上,特别是在鼻子、喉咙以及皮肤的褶皱处,全球约有三分之一的人携带这种细菌。通常健康的情况下,人体不会受其影响。然而由于抗生素滥用,金黄色葡萄球菌已发展出抗药性,当人免疫系统弱化时,即使没有明显的伤口,也容易发生感染。
图片
动漫中金黄色葡萄球菌的拟人形象,图片来源:《工作细胞》
在治疗MRSA感染时,通常使用被称为“最后一道防线”的抗生素——万古霉素。“但一些MRSA对万古霉素产生了耐药性,这种进化的MRSA叫VISA(耐万古霉素金黄色葡萄球菌),导致万古霉素并不能100%有效。”Felix Wong说。
据《柳叶刀》数据,6种主要的耐药性病原体(大肠杆菌、金黄色葡萄球菌、肺炎克雷伯菌、肺炎链球菌、鲍曼不动杆菌和绿脓杆菌)在2019年直接导致全球92.9万人死亡,间接导致357万人死亡。
其中仅MRSA“病原体-药物”组合在2019年直接导致10万多人死亡,远远高于其它耐药菌。今年4月,波音安全问题“吹哨人”之一约书亚·迪恩(Joshua Dean)就是因MRSA感染去世的。当前医疗体系主要依靠感染控制和对症治疗来应对MRSA的威胁,直接攻击病原体的有效方法依然稀缺。
在生物科技领域,创新和商业价值往往是正相关的。即使是研发失败率接近100%的阿尔茨海默症,在巨大的市场潜力吸引下,仍有无数的资金和药企争相投入。
图片
药物开发过程,图片来源:Marinka Zitnik-Harvard,翻译:「甲子光年」
但抗生素领域的行情恰恰相反。
事实上,抗生素市场规模庞大。2022年全球市场规模为423.2亿美元,预计未来几年市场规模会更快速扩张。但抗生素的研发成功率极低,大约只有百万分之一。一款药物的开发大约需要6至10年。”Felix Wong告诉「甲子光年」。
柯林斯对此倍感担忧:“我们正面临着日益严重的抗生素耐药性危机,因为越来越多的病原体对现有抗生素产生了耐药性,而生物技术和制药行业在开发新抗生素方面的渠道又十分匮乏。”
而且在抗生素开发中还有一条悖论:抗生素使用得越广泛,细菌的变异速度就越快,导致药物效力越来越弱。
即使新型抗生素被成功开发,它们往往被视为延缓抗药性发展的最后手段,这又限制了市场规模和盈利潜力。经济压力下,阿斯利康、赛诺菲等大型制药商纷纷退局,抗生素市场几近枯竭。许多药商转而投资慢性病治疗药物的开发,这些药物的市场更大,使用周期也更长。
在新类别的抗生素发掘上,时间似乎停滞了,研究困顿,止步不前。
自1962年推出氟喹诺酮类抗生素(如:诺氟沙星、氧氟沙星),到2000年推出下一个新结构类别恶唑烷酮类抗生素(如:利奈唑胺、特地唑胺),中间整整隔了38年。
但MRSA不会等,相反它每年会夺走大量生命。
难道就无计可施了?
2.打开“AI黑盒”
ALS-4是一种口服型小分子药物,由知临集团开发,2022年已完成I期临床试验。ALS-4可单独使用或与其它现有抗生素(如:万古霉素)组合,以治疗MRSA感染。
但Felix Wong的目标是开发出能直接杀死MRSA的新型抗生素。解决日益严峻的抗生素耐药性危机,寻找全新结构的抗生素或许是最优路径。相比开发一种抗生素,他更倾向于开发一类抗生素。
然而,传统的药物开发过程就像大海捞针,潜在的药物化合物种类多达10的60次方,即“1”后面有60个“0”。
人类需要AI的帮助。
图片
Felix Wong在实验室,图片来源:受访者提供
“AI可以显著提高新药开发临床前阶段的成功率,这也是最关键、最困难的环节之一,它将原本需要5至6年的开发时间缩短到1年左右。”自2019年博士后开始,Felix Wong便与其导师柯林斯一起,利用AI进行药物开发。
2020年柯林斯团队使用深度学习模型识别出了新型抗生素分子,并将其命名为halicin,名字来自电影《2001:太空漫游》中的人工智能系统Hal 9000。
这是人类第一次完全依赖AI发现的全新抗生素
他们开发的模型能识别与抗菌活性相关的化学结构。尽管这种筛选方式已被证明富有成效,但也存在着深度学习模型共同的局限性—— “黑盒(black box)”。也就是说,研究人员无法知道模型是根据哪些特征进行预测的。如果知道模型是如何做出预测的,他们就能更容易地找出或设计出新型抗生素。
“我们在这项研究中要做的就是打开这个黑盒。”Felix Wong说,“这些模型由大量模拟神经连接的计算组成,没有人真正知道这里面发生了什么。”
那么,如何打开黑盒呢?
图片
Felix Wong在实验室,图片来源:受访者提供
Felix Wong的新项目的前期工作与发现Halicin的过程类似。为了收集数据,Felix Wong先采购了一个化合物库(Chemical libary),一共39312种化合物,每个都装在一个小瓶子里,并附上它们各自的化学结构信息等。
收到化合物后,Felix Wong用了大约三个星期,测试了它们对MRSA的生长抑制活性。
然后,团队将生成的数据集喂给了一种特殊的图神经网络(GNN)平台——Chemprop,训练模型识别哪些化学结构特征与抗击MRSA的能力相关。这样模型能够根据新分子的原子排列和化学键连接,识别出具有潜在抗生素活性的新化学结构。
“图神经网络特别适合处理具有节点、边和连接点的数据结构,就像星座图中的星星和连线,可以直观地帮助模型识别和学习化学结构之间的复杂关系。”Felix Wong解释。
图片
药物研究中筛选和可视化化学结构的方法,来源:《Nature》
在实验中,模型如同神秘的水晶球。它能映射出与抗菌性相关的复杂化学结构,只是具体的预测途径却充满未知,无法窥视其内部逻辑。
但科学的探索从不满足于现状。
“一般情况下,流程通常是直接训练一个模型,然后利用这个模型进行预测,从而确定哪些化合物值得进一步实验测试。”Felix Wong的语速变得快了起来,“但由于我们需要考虑AI的可解释性,所以没有直接用模型做预测。我们采用了蒙塔卡洛树搜索算法和图神经网络结合,可以理解为使它们之间的信息进行互通了,让搜索化合物结构的过程变得可解释。”
蒙特卡洛树搜索(Monte Carlo tree search,简写MCTS),是一种结合了蒙特卡洛方法和树搜索策略的算法,主要用于解决大规模搜索空间的问题。这种算法通过模拟来构建一个搜索树,并在此基础上进行决策制定。其核心思想是利用随机模拟来评估不同可能的行动或决策,从而在广泛的可能性中找到最优解。
图片
蒙特卡洛树搜索的步骤:选择、扩展、模拟和反向传播,图片来源:Wikipedia @Mciura
这也是Felix Wong研究的创新之处,“但起初并未想到这一点”。
早在2022年1月5日,他就已经完成了这项研究,并向《Nature》提交了论文。两个月后,Felix Wong等到了拒稿的反馈。四位审稿人中有两位持积极态度,另外两位则“不太看好”。
“我们第一次向《Nature》提交论文时,并没想过加入毒性测试和蒙特卡洛树搜索。当时初稿遭到了审稿人们的批评,认为这个方法缺乏现代感和可解释性。原先我们考虑直接通过人工去分析预测结果,观察哪些化学结构与活性相关。”Felix Wong坦言。
他又重新审视了自己的研究,增加了近乎一倍的实验量。
在攻克可解释性这一难点上,蒙特卡洛树搜索让情况变得“柳暗花明”。
事实证明他的思路是正确的。Felix Wong也借此打开了深度学习模型的内部世界,在药物发现领域实现了可解释AI——不仅预测出哪些化合物可能具有抗菌活性,还能解释抗菌性来自哪些分子结构特性。
MIT News评价这项新研究的一个关键创新点是:可以帮助研究人员设计出更多的药物,并比其他识别药物的模型效果更好。
“这个可解释AI的方法是可以复制的。”Felix Wong表示,“比如说抗癌、抗衰老等,我也希望能将它作用在支原体上。”
安全性同样是药物研发中不可或缺的考量。
《Nature》审稿人另一个反馈是,实验没有考虑到化合物的毒性是一个重大遗漏。因为即使是最有效的抗生素,如果对人体细胞具有毒性,那实用性也会大打折扣。
一个审稿人用漂白剂作比喻。漂白剂虽能杀死任何生物细胞,包括正常细胞,那漂白剂能算作合适的抗生素吗?这也成了Felix Wong补充实验的重点。
后续,他额外训练三个的深度学习模型来预测化合物的细胞毒性,大大缩小了候选化合物的范围。
“新结构的化合物通过选择性地破坏细菌的质子动力系统,来对抗革兰氏阳性病原体,比如具有较厚细胞壁的MRSA。”Felix Wong解释。
三个模型被用来筛选包含超过1200万种化合物的虚拟化学数据库。模型根据分子内的化学亚结构,从中识别出五个类别的283种化合物,它们被预测对MRSA具有潜在活性。
研究团队将283种化合物滴入生长着MRSA的试管中,经过层层筛选,最终两个“天选之子”化合物脱颖而出。它们在杀死MRSA的数量上效果显著——每种化合物都将MRSA数量减少到之前的十分之一,是非常有前景的抗生素候选对象。
图片
最终筛选出的两种化合物的化学结构,图片来源:《Nature》
Felix Wong和团队对两种小鼠模型进行了实验:一种模拟MRSA引起的皮肤感染,另一种模拟MRSA系统性感染。他们发现,这些化合物可以通过破坏细菌细胞膜上的电化学梯度来杀死细菌,而电化学梯度对于许多生命活动是必需的,破坏它就能有效杀死细菌。
实验发现,两种化合物显示出强大的抗菌效果,成功把感染小鼠体内的MRSA数量减少到之前的十分之一。它们在治疗局部和全身的感染中都非常有效,未来有望用来治疗与败血症相关的严重耐药性细菌感染。
“这些分子能针对性地攻击细菌细胞膜,而不会对人体细胞膜造成实质性损害。”坐在「甲子光年」对面的Felix Wong眼神放光,“我们利用AI开辟了药物发现的新路径,不仅仅是开发了一类新的抗生素,更为人类对抗抗生素耐药性提供了新武器。”
3.探索“不老奥秘”
可能和很多孩子不一样,Felix Wong儿时的梦想就是成为“孙悟空”,更确切地说,是“长生不老”。
图片
小时候的Felix Wong,图片来源:受访者提供
“我在6岁时就觉得死亡好可怕。虽然现在看来那时候的自己很天真,但在很长一段时间里,我的愿望一直是‘长生不老’。”Felix Wong告诉「甲子光年」,“直到现在,我依然认为解决生死问题是永恒的几大难题之一(probably one of the biggest problems of forever)。”
在抗衰老这件事上,人类还有很多未知。但Felix Wong正在探索“不老奥秘”,他认真地说:“我希望自己能在50年内研发出来真正延缓衰老的药。”
从本科到博士,Felix Wong尝试了很多学科专业,但最终还是选择回归“初心”。
Felix Wong的家位于美国马萨诸塞州的布伦特里(Braintree)。2010年中学毕业后,17岁的他进入哈佛大学数学专业;研究生时又转向计算机专业;博士期间开始生态和软凝聚态物理学的研究;而博士后期间从事的工作是AI制药。
问及频繁换方向的原因,Felix Wong回答:“因为当时很比较迷茫,没有考虑很多。比如学数学纯属是因为数学好。”中学时的Felix Wong十分叛逆,对学习提不起一点兴趣,逃课、打架,自己没有目标。“虽然好多时候,我都是被打的那个。”Felix Wong笑道。
但幸运的是,一位老师发现了Felix Wong的数学天赋,而Felix Wong也十分享受学习数学的过程。在中学时,Felix Wong已经开始学习大学的数学课程,在他看来,“数学都是逻辑,发现问题,再解决问题,这种简单直接的方式让人着迷,像在游戏里打Boss。”
游戏之外的“Boss战”也在继续着。
从博士开始,Felix Wong一直穿梭在各大学术会议中。最初,他只是为了寻找未来的研究方向,但在深入了解生物医药行业的真实情况后,他开始重拾儿时的梦。
“现在的我比小时候目标更清晰。虽然无法逆转自然规则的让人类永生,但我想尽可能地延长人类寿命。”这也成了Felix Wong深扎AI制药领域的驱动力。
学术会议上与制药企业里的氛围截然不同。
疾病面前,人类始终踌躇在希望和绝望之间。在研究论文里,一次次的“突破”“创新”和“成功”,讲述的都是科学进步的希望,仿佛人类战胜疾病指日可待;但在药企的讨论里,“困境”“难点”和“失败”才是主题词,尤其与开发抗生素相关。
为了这项研究,Felix Wong熬了三年。
当时Felix Wong所住的公寓与布罗德研究所仅隔着一条马路。他每天披星戴月地走去实验室,再披星戴月地走回来,“基本醒着的时侯都在工作”。尤其在人工测试39312种化合物时,“忙得基本与世隔绝”。
有时压力大了,Felix Wong就会去波士顿的查尔斯河边走走,或者喝奶茶,然后继续埋头做实验。
图片
夜晚也灯火通明的布罗德研究所,来源:「甲子光年」拍摄
在做研究的同时,Felix Wong也开始了创业之旅。他和加州大学圣地亚哥分校助理教授马克斯·威尔逊(Max Wilson)在2023年创办了Integrated Biosciences公司,主要通过结合合成生物学和深度学习来控制细胞应激反应,开发更先进的医疗方法。柯林斯很看好他的能力和研究,也因此出任了Integrated Biosciences的顾问。
细胞应激反应与多种疾病有关,如神经退行性疾病、癌症、糖尿病、骨关节炎等年龄相关疾病。Felix Wong和他的团队开发了一项生物合成技术,可以在实验室环境中模拟(虚拟激活)细胞的应激反应。通过这种技术,他们能够发现并迅速确定针对这些应激反应的治疗药物的靶点。
同时,他们还开发了一种新的深度学习技术,用于快速识别小分子化合物,可以加快新药的发现过程。这些针对细胞应激反应的开发小分子药物,有望帮助人们实现健康老龄化。
老实地讲,如果能让人类的平均寿命延长20—30年, 就已经是莫大的胜利了。”Felix Wong说,“其实生物技术(Biotech)是个很有意思的领域,实际的科研过程很有成就感。让药物研发不仅停留在实验室,无论是解决疾病问题还是衰老问题,都是令人激动的目标。”
但可以肯定的是,这一条困难重重却充满乐趣的路。对抗时间就像绝望与希望的制衡,在实现目标前,他只想——但行好事,莫问前程。
*参考资料:
《对话感染科专家:今年出现肺炎支原体感染暴发并不意外》,新京报
《呼吸道传染病高发季如何防护?听听专家怎么说》,北京友谊医院
《肺炎支原体大环内酯类抗生素全球耐药现状和耐药机制研究进展》,中华微生物学和免疫学杂志
《Discovery of a structural class of antibiotics with explainable deep learning》,Nature
《A Deep Learning Approach to Antibiotic Discovery》,Cell
《Global burden of bacterial antimicrobial resistance in 2019: a systematic analysis》,The Lancet
《Harnessing AI to develop the first new class of antibiotics this generation》,The Audacious Project
《Artificial intelligence yields new antibiotic》,MIT News
《Using AI, MIT researchers identify a new class of antibiotic candidates》,MIT News
(封面图来源:受访者提供)