【Nature子刊】AI革新药物发现:中国科学院赵毅团队利用深度生成模型揭示化学扰动转录反应的新机制

图片

【导读】了解对化学扰动的转录反应是药物发现的核心,但对疾病-化合物组合进行详尽的实验筛选是不可行的。为了克服这一限制,团队在这里介绍了PRnet,这是一种扰动条件的深度生成模型,可预测对新型化学扰动的转录反应,这些扰动从未在批量和单细胞水平上进行过实验扰动。

2024年10月26日,中国科学院计算机网络信息中心赵毅、四川大学附属华西医院杨胜勇团队合作在期刊《Nature Communications》上发表了题为“Predicting transcriptional responses to novel chemical perturbations using deep generative model for drug discovery”的研究论文。评估结果表明,PRnet在预测新化合物、通路和细胞系的反应方面优于其他方法。PRnet能够根据基因特征,对疾病进行基因水平反应解释和计算机药物筛选。PRnet进一步鉴定并实验验证了针对小细胞肺癌和结直肠癌的新型候选化合物。PRnet生成了扰动谱的大规模整合图谱,涵盖88个细胞系、52个组织和各种化合物库。PRnet提供强大且可扩展的候选药物推荐工作流程,并成功推荐了233种疾病的候选药物。

图片

https://www.nature.com/articles/s41467-024-53457-1

关于深度生成模型 

 01 

批量和单细胞RNA测序(scRNA-seq)实验,有助于在组学水平上对化学扰动进行高通量筛选(HTS)。最近的HTS研究,已经实验分析了数千种将细胞或细胞系暴露于化合物的独立扰动。尽管已经取得了令人鼓舞的进展,但实验筛选化学扰动仍然是一个耗时且昂贵的过程,新疗法的发现率很低。


在这项研究中,团队介绍了PRnet,这是一种灵活且可扩展的扰动条件深度生成模型,用于预测对新型化学扰动的转录反应,这些扰动从未在批量和单细胞水平上受到实验扰动。PRnet的可学习潜在空间,有助于基因水平的反应解释和捕获异质性。评估表明,PRnet在预测批量和单细胞HTS数据中对新化合物、通路和细胞系的转录反应的变化和表达方面优于其他方法。PRnet已被用于鉴定针对小细胞肺癌(SCLC)的新型生物活性化合物,并寻求针对结直肠癌(CRC)的新型天然化合物。


团队利用PRnet对各种化合物库进行计算机筛选,并生成了一个虚拟的大型扰动图谱集成图谱,涵盖88个细胞系和52个组织,以及包含935种FDA批准的药物、4,158种活性化合物、30,456种天然化合物和29,670种药物样的化合物库。PRnet还根据基因集的参考变化,为疾病提供了强大且可扩展的候选药物推荐工作流程。PRnet根据概况图谱成功推荐了577种候选药物清单,用于治疗233种不同的疾病。在3种代谢紊乱病例中,包括非酒精性脂肪性肝炎(NASH)、多囊卵巢综合征(PCOS)患者和炎症性肠病(IBD),PRnet推荐的药物得到了先前人类或动物研究文献的支持。

PRnet确定了针对小细胞肺癌的活性化合物

 02 

鉴于SCLC的几种新型细胞系,即NCI-H69、NCI-H526、NCI-H446、NCI-H209和NCI-H196,以及DMS114,团队首先使用PRnet,预测SCLC细胞系对敏感化合物的转录反应。然后,团队在计算机中筛选了两个用户定义的化合物库,以确定针对SCLC的潜在候选化合物,即来自Selleckchem的活性化合物库(4,158 种化合物)和内部类药化合物库(29,670 种化合物)。通过计算机筛选,PRnet预测了每种化合物在扰动6个细胞系的8个浓度梯度上的转录反应,每个场景重复3次,以提高计算稳健性,并计算出每种化合物的平均扰动后表达变化的基因等级。之后,将其细胞系上敏感化合物预测的上调/下调基因,用作GSEA基因特征输入,计算富集分数。然后,团队进行GSEA计算文库中化合物的富集分数,并根据它们的分数进行排序 。最终,选择排名靠前(敏感化合物富集评分排名≤3)的3种化合物((+)-方奇诺啉、(+)-JQ-1和SEL120-34A HCl)作为候选集。团队还通过计算浓度梯度下扰动转录谱的富集分数,来探索候选化合物的合适活性浓度。


团队利用MTT测定,来检查候选化合物对SCLC细胞的活性。选择6种人SCLC细胞系(NCI-H69、NCI-H526、NCI-H446、NCI-H209和NCI-H196,以及DMS114)进行实验。结果显示,SEL120-34A HCl(化学文摘社编号:1609452-30-3)和(+)-方奇诺啉(化学文摘社编号:436-77-1)对小细胞肺癌(SCLC)细胞系的活性。SEL120-34A HCl和(+)-方奇诺啉对SCLC细胞的增殖表现出显著的抑制作用,并表现出IC50(半数最大抑制浓度)小于10μmol/L,表明它们对SCLC细胞活力的抑制作用。这些发现表明,SEL120-34A HCl和(+)-方奇诺啉在SCLC治疗中的潜在治疗效果,突出了它们作为针对这种侵袭性肺癌亚型的活性化合物的有前途的作用。

图片

PRnet确定的针对小细胞肺癌和结直肠癌的候选者。

PRnet发现天然化合物对抗结直肠癌

 03 

团队将PRnet的应用,扩展到筛选用于治疗CRC的新型天然化合物。团队首先利用PRnet,预测14种CRC细胞系 (HT29、LOVO、MDST8、RKO、HT115、SW948、SNU1040、SNUC4、SNUC5、SW480、SW620、HCT116、CL34和NCIH508)中敏感化合物的扰动后转录谱。然后,团队使用敏感化合物细胞系上预测的上调/下调基因,作为GSEA基因特征。之后,团队还在计算机中筛选了一个包含30,456种天然成分的大规模天然化合物库。PRnet预测了每种化合物在8个浓度梯度上的转录响应,扰动14个细胞系,有3次重复,并计算了化合物的扰动后平均基因等级。


团队利用MTT测定,来检查候选化合物对CRC细胞的活性。选择6种人CRC细胞系,即 HT29、SW480、Caco-2、SW620、HCT116和Colo205进行实验。结果显示,7-甲氧基罗斯马醇(CAS No. :113085-62-4)和桑呋喃Q(CAS No. :101383-35-1)抑制CRC细胞系的活力。7-甲氧基罗斯马醇和桑呋喃Q,中度抑制CRC细胞系的活力。这些发现显示了7-甲氧基罗斯马醇和桑呋喃Q 对CRC细胞系的活性,表明它们在CRC治疗中的潜在疗效。

图片

PRnet在大型扰动剖面集成图谱上,提供了一个健壮且可扩展的推荐工作流程。

总结

 04 

1. PRnet是一个深度生成模型,能够预测新型化学扰动的转录反应,尤其在大规模细胞和单细胞水平上。


2. PRnet可以预测特定疾病的化合物文库的转录反应,推断疾病状态,并推荐候选药物,具有泛化到新化合物和细胞系的能力。


3. 反向特征范式在联系疾病和药物方面有效,但可能不适用于所有疾病,且转录变化与药物敏感性并非总是直接相关。


4. 癌细胞的表型可塑性和耐药性涉及复杂调节网络,可能无法仅通过基因表达变化来完全理解。化合物筛选过程中需要考虑基因水平影响以外的表型影响,如AUC或IC50,以全面评估化合物的影响。


5. PRnet的未来应用可能扩展到包括遗传扰动在内的各种扰动实验,以增强模型的预测能力并促进药物发现。


参考资料:


1. Subramanian, A. et al. A next generation connectivity map: L1000 platform and the first 1,000,000 profiles. Cell 171, 1437–1452 (2017).


2. Srivatsan, S. R. et al. Massively multiplex chemical transcriptomics at single-cell resolution. Science 367, 45–51 (2020).


【关于投稿】

转化医学网(360zhyx.com)是转化医学核心门户,旨在推动基础研究、临床诊疗和产业的发展,核心内容涵盖组学、检验、免疫、肿瘤、心血管、糖尿病等。如您有最新的研究内容发表,欢迎联系我们进行免费报道(公众号菜单栏-在线客服联系),我们的理念:内容创造价值,转化铸就未来!

转化医学网(360zhyx.com)发布的文章旨在介绍前沿医学研究进展,不能作为治疗方案使用;如需获得健康指导,请至正规医院就诊。