人工智能助力CT影像识别 帮助提高新冠疫情诊断正确率

图片
新冠状病毒蔓延之下,医生需要寻求更加快捷的诊断方式。除了试剂检测之外,胸部CT的影像识别也成为了筛查病人的主要手段。然而,一张张片子通过人眼检测显然是耗时又耗力,科技公司的人工智能技术就在这里体现了优势。
2月15日,阿里巴巴旗下达摩院和阿里云宣布研发出一套针对新冠状病毒肺炎临床人工智能诊断技术,可以在20秒内做出CT影像的判断,分析结果正确率达到96%。16日,河南版“小汤山医院”(郑州岐伯山医院)率先采用。五天后,阿里巴巴披露,使用范围扩大到湖北、上海、广东、江苏等16个省市26家医院,并已对3万个疑似病例进行诊断。接下来,其将在百家医院完成部署应用。
阿里巴巴集团副总裁、达摩院高级研究员华先胜接受新京报记者独家专访时表示,能够快速应用起来,主要是源于达摩院医疗人工智能团队在CT影像分析领域已经有四年的研究基础,对肺部各种诊断都曾有过研究。这是一个拥有几十名研究者的团队。
2017年7月,国际肺结节检测大赛LUNA16上,华先胜当时负责的iDST(达摩院前身)视觉计算团队创新地使用了单阶段方法,机器全自动读取病人的CT序列,直接输出检测到的结果凭借89.7%的平均召回率打破纪录,夺得冠军。
这次疫情发生后,“团队成员就开始关注了”,华先胜告诉新京报记者,以往研究的技术模型具有比较强的普适性,所以就可以针对此次疫情的检测要求做出调整。研发初期该团队利用小数据就可以悬链模型,随后可通过引入更多的数据不断优化。最初的样本中新冠状病毒患者的比例是五分之一。
2月10日,达摩院团队从医疗影像行业合伙伙伴那里,拿到了样本数据,进行AI模型的训练。通过两天时间就研发出了第一版的算法模型,并且在云端的接口也都准备好了。又经过两天的调试优化后,便开始与医院对接部署,并通过公共云输出其能力。
由于郑州岐伯山医院原本就由阿里云参与IT系统建设,在一线有很多阿里云的员工,对接更为方便,也因此首先开始使用这套系统帮助医生快速筛查新冠肺炎病例。这套系统可以将原本医生观看CT片得出结论的时间(5到30分钟)缩短至20秒,而且这还包含了数据上传和结果回传的时间。
对于如何进一步提升准确率,华先胜表示,一般深度学习的模型从一个问题过度到另一个问题的时候,并不需要大量样本,就能拿到一个还不错的模型。当然数据越多效果更好,这也是深度学习的优势。这次我们训练的样本数据规模在业界已经比较领先了。
不仅如此,达摩院的团队还将负例样本用于模型训练,也就是非新冠病毒确诊患者的CT影像片子,这样也可以进一步提升识别的准确率,也就是告诉机器什么不是冠状病毒患者的特征,以及和其他影像的区别。但目前这样的标注需要大量专家,复工前期约5000个样本量时,研究员们自己参与标注,但量起来后,达摩院将在这方面选择了产业链的协助。
与此同时,除了准确率,对于检测结果判断的指标还包括敏感性、特异性等。如果对是否为新冠患者判断对了,准确率就会增加,这个数值越高越好,而敏感性是指在所有患者的样本中的识别准确率,这个指标更为重要,而特异性是指负例样本。
华先胜表示,今天人工智能的应用还只是医疗的辅助诊断,因为除了技术问题,还有法律法规的问题。事实上,在技术层面,这个系统已经可以帮助医生提升效率,为经验还不丰富的医生提供有价值的参考,从而使得整个诊断速度加快。但机器也会出错,这一方面要靠数据积累和技术进一步提升,但更重要的是法律层面的定义,让人工智能诊断可以被实践。
不过,华先胜也倡导多种手段应该综合应用,因为每一个都很难做到100%的准确率,医生的使用也应有其一套逻辑。至于临床应用诊断时,医生也会根据症状、主要诉求和以往病史等因素综合考虑。也就是说,属于影像学诊断方法的CT影像和属于病原学证据的核酸检测是从两个不同维度去观察一个事物,并非取代关系。
人工智能目前是对已有的数据进行学习,而现实的情况非常复杂,临床数据不断发生变化,算法也就需要不断演进、更新。由于病毒发生变异对肺部影像的影响并没有那么快,所以这种细微变化是可以通过在线学习不断去更新,从而调整算法。但是如果要从简单的是否判断,进一步到详细诊断,那么仍需要系统学习大量的数据,才可不断改进增强。
除郑州岐伯山医院之外,华先胜表示,其他医院落地会因为先前的经验而加快。阿里云已经准备了多种的部署方式,除了通过合作伙伴的产品接入公共云服务外,也可以通过本地化一体机的方式部署,只不过当前疫情之下,后者可能涉及设备搬运,部署起来速度会慢一些。截至2月23日,已有41家医院应用这一套系统,还有100多家正在对接。
事实上,除了阿里巴巴,一些人工智能创业公司也在布局这一领域。依图科技表示,其研发了胸部CT新冠肺炎智能评价系统,并且已在华中科技大学同济医学院附属协和医院、武汉大学中南医院等几十家抗疫医疗机构上线。商汤方面也推出了相应的解决方案,其目前可以识别出非健康的影像,为医生提供警示。
诊断过程中,CT影像已经成为新型冠状病毒性肺炎的重要诊疗决策依据。2月5日,国家卫生健康委员会最新发布的《新型冠状病毒感染的肺炎诊疗方案(试行第五版)》中明确指出:“疑似病例具有肺炎影像学特征者,为临床诊断病例。”
华先胜表示,在这一领域存在着一定的技术门槛,目前大家都在各自能够影响的范围内提供服务,这是一件好事。每个团队都有自己独特的技术,算法的创新。达摩院的优势是利用了阿里云的云服务,使得算法得以快速推进落地应用,让更多的医院享受到该技术。
新京报记者 梁辰
编辑 王宇 校对 何燕