效率提升1200倍!麻省理工开发AI制药新模型

智东西(公众号:zhidxcom)
编译 | 夏舍予
编辑 | 徐珊
智东西7月14日消息,据外媒Tech Xplore报道,麻省理工学院的研究人员最近开发了一种叫做EquBind的新模型,这个模型可以提前预测新蛋白质分子的结构,提升药物开发的效率。
目前这项技术已经得到了业界内的认可,阐述这项技术的论文也将在7月被国际机器学习会议(ICML)会议接收。
一、速度提升1200倍,EquBind模型能迅速筛选类药物分子
目前,药物研发是一件漫长而又昂贵的事情。其中最主要的原因就是开发药物的成本十分昂贵。这种成本不仅包括数十亿美元的资金投入,还包括长达数十年的研究时间。
而且在研发的过程中,90%的药物都会因为无效或副作用太多而研发失败,只有10%的药物能够顺利通过食品和药物管理局的检查,被批准上市。
因此,制药公司会提高研发成功药品的价格,来弥补研发失败药品造成的损失,所以目前有些药物的价格居高不下。
图片
▲一些蛋白质分子结构
如果研究人员想要进行药物开发,就要先找到有开发潜力的类药物分子(drug-like molecules)。药物研发进程缓慢还有另一个重要的原因,那就是现存的类药物分子数量庞大。数据显示,目前现存的类药物分子多达1016种,这个数字远远超出了现有的分子计算模型的计算上限。
为了处理数据如此庞大的分子,加快药物开发的进程,麻省理工学院电子工程和计算机科学系的研一学生Hannes Stärk开发了一种叫做“EquBind”的几何深度学习模型。EquBind比现存最快的分子计算对接模型运行速度快1200倍,能够更快地找到类药物分子。
二、EquBind模型能精准预测蛋白质结构,提升药物研发效率
目前大多数传统的分子计算对接模型都是通过一种叫做“配体-蛋白质”(ligand-to-protein binding)的方法寻找类药物分子。具体而言,模型需要先接收大量的样本分子,然后让配体与各种分子进行结合,然后模型再对不同分子进行评分,再以最后的排名来筛选出最合适的分子。但是这种做法流程繁复,模型寻找类药物分子的效率较低。
Hannes Stärk对这个过程做了一个形象的比喻,他说:“以前的典型的‘配体-蛋白质’方法就好像是试图让模型把钥匙插入有很多钥匙孔的锁,模型要花费大量的时间为钥匙和每一个锁孔的适配度打分,再选出最合适的那个。”
他继续解释道:“而EquBind可以跳过最花费时间的步骤,可以在遇到新分子时提前预测最合适的‘锁孔’,这就是所谓的‘盲配对’(blind docking)。EquBind有内置的几何推理算法,能够帮助模型学习分子的基本结构。这个算法可以让EquBind在遇到新的分子时直接预测出最合适的位置,而不用花费大量的时间尝试不同的位置并打分。”
图片
▲麻省理工学院
三、EquBind模型已在业界成功应用,作者期待更多反馈
这个模型引起了治疗公司Relay的首席数据官帕特·沃尔特斯(Pat Walters)的注意。沃尔斯特建议Hannes Stärk的研究小组用这种模型来进行用于治疗肺癌、白血病和胃肠道肿瘤的药物开发。通常而言,用于这些领域药物的蛋白质配体很难用大多数传统的方法对接,但是EquBind却能让它们成功对接。
图片
▲两种治疗肺癌的抑制剂药物
沃尔特斯说:“EquBind为蛋白质对接问题提供了一种独特的解决方案,它解决了结构预测和绑定位点识别等问题。这种方法可以很好地利用数千种公开的晶体结构信息,EquBind可能会以新的方式影响这个领域。”
发表这项技术的论文将在7月被国际机器学习会议(ICML)接收,该论文的作者Hannes Stärk表示:“我很期待能在这次会议上收到一些关于EquBind模型的改进意见。”
结语:AI与制药适配度极佳,发展势头正盛
AI制药是一个2020年才走进公众视野的新兴领域。
制药领域是一个天然的AI场景。新药研发的长周期、高成本、低成功率,给AI留下了庞大的用武之地:机器可以自主学习数据、挖掘数据,总结归纳专家经验外的药物研发规律,继而优化药物研发流程中的各个环节,这不仅可以提升药物研发效率与成功率,还有望降低研发费用和试错成本。
因为这样的特性和发展潜力,目前AI制药势头正盛。但也有业内人士唱衰,说AI在制药过程中扮演的终归只是辅助角色,绕不开行业固有的流程和机制,不可能用两三年的时间做完十年的事。
但是整体而言,目前AI制药领域还是不断有新的技术突破,发展蒸蒸日上。
来源:Tech Xplore