“黑箱”开启之日,AI辅助药物设计将大放异彩

人工智能(AI)是否会改变传统反复试验形式的药物开发过程,从而成为制药行业的革命性力量?最近发表在《健康数据科学》杂志上的一篇文章观点认为,主动学习和可解译的人工智能会在行业内引导产生积极的结果。
“近来,人工智能在药物设计上的应用取得了可喜的进展。然而,我们还远不能确定这些初级的实验结果能否更加成功地转化为更为有效的药物,” 北京大学人工智能专家和副教授,文章共同作者马剑竹博士说,“使数据的价值得以有效利用是构建药物开发人工智能的关键。”
图片
人工智能(AI)是否会改变传统反复试验形式的药物开发过程,从而成为制药行业的革命性力量?| 图虫创意
作者进一步指出,传统的人工智能辅助药物开发的主要局限性在于其线性范式。如果没有来自下游实验结果的连续反馈,人工智能预测的模型只是“根据数据得出的猜测”。而主动学习(人工智能的一个子领域)在AI建模和下游实验评估之间创建了一个有效的反馈回路,具有能够产生有效实验结果的巨大潜力。
图片
有反馈回路的黑箱模型 | Nargesfn, Wikimedia Commons / CC BY-SA 4.0 (https://creativecommons.org/licenses/by-sa/4.0/deed.en)
此外,传统AI模型背后的“黑箱”阻拦了科学家使用算法进行假设验证和背后逻辑数据的挖掘。况且,在药物开发的过程中,预测模型背后的内在逻辑对于设计正确的药物分子是至关重要的。因此,作者指出“人工智能模型应当能够根据其训练数据来揭示特定模型是如何获得的”。作者认为,可解译的人工智能是机器学习领域的一个积极发展方向
“未来十年,数据和计算紧密结合将成为人工智能药物研发的特色,可解译的人工智能与实验生物学配合组成了一个主动学习循环,并能够相互反馈通报,”马博士补充道。“它将可以通过迭代改进工作流程并产出可解译的数据,使科学家可以监测、分析和理解药物开发的每一个阶段。”
参考文献
[1] Luo Y, Peng J, Ma J. Next Decade’s AI-Based Drug Development Features Tight Integration of Data and Computation[J]. Health Data Science, 2022, 2022.
[2] https://www.eurekalert.org/news-releases/943844
编译:茵陈
编辑:酥鱼
排版:尹宁流
研究团队
通讯作者马剑竹:现担任北京大学人工智能研究院副教授,此前曾任美国普渡大学生物化学系、计算机系助理教授。马剑竹主要从事计算生物学和生物信息学的研究,主要研究科学、医学及卫生领域中数据带来的挑战。马博士曾发表多篇生物医学应用相关论文(收录于Nature Methods、Nature Cancer、Cell、Nature Communications、PNAS等),其论文、发言、海报及研究曾在RECOMB、ISMB等顶级会议中获奖。马剑竹领导开发了开源软件包和公开的蛋白质三维结构预测服务器RaptorX。RaptorX获得两次国际蛋白质结构预测比赛总分第二名,一次高难度组第一名和一次蛋白质接触图比赛的第一名。国际顶级期刊Science在technology feature专栏中认为RaptorX是目前主流的三个蛋白质结构预测服务器之一。目前RaptorX已经为用户提供了上百万次的预测服务。
第一作者罗宇男:自 2022 年 1 月起,在佐治亚理工学院计算科学与工程学院 (CSE) 担任助理教授。于伊利诺伊大学厄巴纳-香槟分校计算机科学系获得博士学位。在此之前,他于 2016 年在清华大学姚班获得计算机科学学士学位。作者对计算生物学和机器学习有着广泛的兴趣,专注于开发人工智能和数据科学方法来揭示生物学和医学的核心科学见解。最近的兴趣包括深度学习、功能基因组学、癌症基因组学、药物重新定位和发现,以及人工智能引导的生物设计和发现。
第二作者彭健:自 2015 年起担任 UIUC 计算机科学教授。在加入伊利诺伊州之前,曾于麻省理工学院计算机科学与人工智能实验室进行博士后研究,曾以访问科学家的身份前往Whitehead Institute进行交流。于2013年获芝加哥大学丰田技术学院计算机科学博士学位。彭健博士的主要研究领域为生物信息学、化学信息学和机器学习,其合作开发的算法在多项科学挑战赛中获得佳绩,包括蛋白质结构预测技术的关键测试(CASP),及转化医学和药物基因组学的DREAM 挑战。彭健博士还是Overton奖、美国自然科学基金委员会杰出青年奖、艾尔弗·斯隆基金会斯隆研究奖的获得者
论文信息
发布期刊《健康数据科学》Health Data Science
发布时间2022年1月18日
论文标题Next Decade’s AI-Based Drug Development Features Tight Integration of Data and Computation
(DOI:https://doi.org/10.34133/2022/9816939)
如果想了解更多产业界和科技创投资讯,
欢迎关注果壳硬科技
图片