效率提升1200倍！麻省理工开发AI制药新模型

智东西

2022-07-14 15:45发布于北京智东西官方账号

智东西（公众号：zhidxcom）

编译 | 夏舍予

编辑 | 徐珊

智东西7月14日消息，据外媒Tech Xplore报道，麻省理工学院的研究人员最近开发了一种叫做EquBind的新模型，这个模型可以提前预测新蛋白质分子的结构，提升药物开发的效率。

目前这项技术已经得到了业界内的认可，阐述这项技术的论文也将在7月被国际机器学习会议（ICML）会议接收。

一、速度提升1200倍，EquBind模型能迅速筛选类药物分子

目前，药物研发是一件漫长而又昂贵的事情。其中最主要的原因就是开发药物的成本十分昂贵。这种成本不仅包括数十亿美元的资金投入，还包括长达数十年的研究时间。

而且在研发的过程中，90%的药物都会因为无效或副作用太多而研发失败，只有10%的药物能够顺利通过食品和药物管理局的检查，被批准上市。

因此，制药公司会提高研发成功药品的价格，来弥补研发失败药品造成的损失，所以目前有些药物的价格居高不下。

▲一些蛋白质分子结构

如果研究人员想要进行药物开发，就要先找到有开发潜力的类药物分子（drug-like molecules）。药物研发进程缓慢还有另一个重要的原因，那就是现存的类药物分子数量庞大。数据显示，目前现存的类药物分子多达1016种，这个数字远远超出了现有的分子计算模型的计算上限。

为了处理数据如此庞大的分子，加快药物开发的进程，麻省理工学院电子工程和计算机科学系的研一学生Hannes Stärk开发了一种叫做“EquBind”的几何深度学习模型。EquBind比现存最快的分子计算对接模型运行速度快1200倍，能够更快地找到类药物分子。

二、EquBind模型能精准预测蛋白质结构，提升药物研发效率

目前大多数传统的分子计算对接模型都是通过一种叫做“配体-蛋白质”（ligand-to-protein binding）的方法寻找类药物分子。具体而言，模型需要先接收大量的样本分子，然后让配体与各种分子进行结合，然后模型再对不同分子进行评分，再以最后的排名来筛选出最合适的分子。但是这种做法流程繁复，模型寻找类药物分子的效率较低。

Hannes Stärk对这个过程做了一个形象的比喻，他说：“以前的典型的‘配体-蛋白质’方法就好像是试图让模型把钥匙插入有很多钥匙孔的锁，模型要花费大量的时间为钥匙和每一个锁孔的适配度打分，再选出最合适的那个。”

他继续解释道：“而EquBind可以跳过最花费时间的步骤，可以在遇到新分子时提前预测最合适的‘锁孔’，这就是所谓的‘盲配对’（blind docking）。EquBind有内置的几何推理算法，能够帮助模型学习分子的基本结构。这个算法可以让EquBind在遇到新的分子时直接预测出最合适的位置，而不用花费大量的时间尝试不同的位置并打分。”

▲麻省理工学院

三、EquBind模型已在业界成功应用，作者期待更多反馈

这个模型引起了治疗公司Relay的首席数据官帕特·沃尔特斯（Pat Walters）的注意。沃尔斯特建议Hannes Stärk的研究小组用这种模型来进行用于治疗肺癌、白血病和胃肠道肿瘤的药物开发。通常而言，用于这些领域药物的蛋白质配体很难用大多数传统的方法对接，但是EquBind却能让它们成功对接。

▲两种治疗肺癌的抑制剂药物

沃尔特斯说：“EquBind为蛋白质对接问题提供了一种独特的解决方案，它解决了结构预测和绑定位点识别等问题。这种方法可以很好地利用数千种公开的晶体结构信息，EquBind可能会以新的方式影响这个领域。”

发表这项技术的论文将在7月被国际机器学习会议（ICML）接收，该论文的作者Hannes Stärk表示：“我很期待能在这次会议上收到一些关于EquBind模型的改进意见。”

结语：AI与制药适配度极佳，发展势头正盛

AI制药是一个2020年才走进公众视野的新兴领域。

制药领域是一个天然的AI场景。新药研发的长周期、高成本、低成功率，给AI留下了庞大的用武之地：机器可以自主学习数据、挖掘数据，总结归纳专家经验外的药物研发规律，继而优化药物研发流程中的各个环节，这不仅可以提升药物研发效率与成功率，还有望降低研发费用和试错成本。

因为这样的特性和发展潜力，目前AI制药势头正盛。但也有业内人士唱衰，说AI在制药过程中扮演的终归只是辅助角色，绕不开行业固有的流程和机制，不可能用两三年的时间做完十年的事。

但是整体而言，目前AI制药领域还是不断有新的技术突破，发展蒸蒸日上。

来源：Tech Xplore

查看原图 732K