Science Bulletin封面文章 | 医学图像分割新突破:用“棱镜”实现多专家标注的智能融合

图片

医学图像分割研究在医疗领域扮演着至关重要的角色,它通过精确分离影像中的解剖结构或病灶区域,辅助医生进行细致观察,是实现智能医疗、优化临床决策的坚实基础,拥有非常广阔的应用前景。为确保分割参考标准的准确性与可靠性,通常会邀请多位医学专家进行标注。然而,由于不同专家的手工标注存在不可避免的差异,研究面临着“多标注融合问题”,即如何科学有效地整合多个专家意见(图1)。解决这一挑战,不仅能提升分割算法的精度与一致性,更能为医学人工智能研究中普遍存在的标注质量评估提供新思路。

图片

图1 对于同一张待标注图片,不同专家标注的目标区域存在差异示意

之前的研究者主要从两个方面来解决“多标注融合问题”。第一种方法是从多个独立标注中识别潜在的参考标准,即评估每个标注者的置信度并通过加权来融合标注,得到一个银标准标注用于训练分割模型。第二种方法是通过直接从多个标注中捕捉不同标注者之间的一致性和差异性,学习校准分割模型。



近日,针对医学图像分割领域的多标注融合问题,中国中医科学院西苑医院刘玥团队、华南理工大学许言午团队、四川省人民医院肖力及深圳眼科医院杨卫华团队联合Science Bulletin上发表了题为“Multi-rater Prism: learning self-calibrated medical image segmentation from multiple raters”的封面文章。该文章提出了一种新的Multi-rater Prism框架,这个框架包含聚合棱镜(ConP)和发散棱镜(DivP)两大模块,分别负责校准分割和多标注者置信度学习任务,通过这两个任务的循环迭代实现多标注下分割结果的有效自我校准,进而提升分割准确性,为医学乃至通用领域中不确定性复杂数据处理提供了新思路。



图片

该研究提出了一种新的Multi-rater Prism框架(下文简称“MrPrism”,图2)来解决“多专家标注融合问题”,这个框架通过迭代优化的方式,结合了多标注者置信度学习和校准分割任务,最终生成一个反映标注者间一致性的自我校准分割结果。受迭代半二次优化的启发,MrPrism以一种循环迭代的方式将多标注置信度学习和校准分割的任务结合起来。在这个过程中,MrPrism学习了不同标注者间的差异性,同时考虑了图像的语义属性,并最终收敛到反映标注者间一致性的自校准分割结果。具体而言,MrPrism中包含聚合棱镜(ConP)和发散棱镜(DivP)两个任务,ConP基于DivP估计的多标注置信度图来学习校准分割,而DivP则基于ConP估计的分割掩膜生成多标注置信度图。

图片

图2 MrPrism方法框架示意图

为了验证MrPrism的有效性,研究团队进行了多个分割任务的对比实验。实验使用多种医学图像分割任务的数据集,如眼底彩照中视杯视盘分割任务的REFUGE和RIGA数据集,大脑MRI图像中肿瘤分割任务的QU-BraTS 2020数据集,肺结节CT数据集LIDC-IDRI,以及包含CT和MRI图像中多个器官和病灶分割任务的QUBIQ数据集。实验中,团队将MrPrism与多个现有先进方法进行比较,通过计算Dice系数,评估模型效果。此外,研究人员还进行了全面的消融实验,包括对每个设计模块性能的讨论、对不同标注者数量的讨论、对不同标注者之间差异性大小的讨论等。

综上,MrPrism框架在处理多标注者不一致性方面性能卓越,在多个分割任务上实现了超越现有先进方法的性能,尤其当标注者之间差异性较大时,MrPrism能够通过有效的自校准设计,大幅提升分割精度。这一框架的提出,不仅为医学图像分割中的多标注融合问题提供了新的优化解决方案,也为解决相关研究领域中的不确定性消除问题和人工智能产业发展中的标注质量问题提供了新思路。

华南理工大学未来技术学院吴俊德和方慧卉为该文共同第一作者,中国中医科学院西苑医院(国家中医心血管病临床医学研究中心)刘玥、深圳眼科医院杨卫华、四川省人民医院肖力及华南理工大学许言午为共同通讯作者。该研究得到中国中医科学院卓越青年科技人才专项、国家自然基金委员会等项目的资助。