《柳叶刀》最新研究:皮肤病诊断算法大都缺少深肤色数据

发表在《柳叶刀》的一项最新研究显示,目前用于训练皮肤病诊断算法的公共皮肤图像数据集缺乏足够的肤色信息。在提供肤色信息的数据集中,只有极少数图像的肤色较深——如果使用这些数据集构建算法,对于白人以外的其他人种的诊断可能并不准确。
研究人员研究了21个可免费访问的皮肤状况图像数据集,这些数据集一共包含超过 10万张图像。研究人员写道,这些的皮肤图像数据集越来越多地用于开发皮肤癌诊断的机器学习算法。
该论文的研究背景部分写道,机器学习在医疗领域的应用中,医学图像分类尤其是皮肤科领域,近年来取得了长足的进步,比如通过皮肤镜或照片诊断皮肤癌。机器学习算法具有通过数字图像分析来自动诊断皮肤恶性肿瘤的能力,在过去5年中,机器学习算法的诊断准确性已被证明在实验环境中可与皮肤科医生媲美,甚至超过皮肤科医生。
然而,这项研究对10万张皮肤图像进行统计后发现,其中只有1400多张标注了有关患者种族的信息,只有2236张标注了肤色信息。研究人员认为,在这些皮肤图像数据集中,深色皮肤类型的代表性严重不足——在具有肤色信息的图像中,只有11个来自Fitzpatrick量表(一个对肤色分类的量表)上肤色最暗的两个类别的患者。在标注了种族的图像中,没有来自非洲、非洲裔加勒比或南亚的患者的图像。
研究人员认为,这有可能导致算法的偏差,用这些数据集训练出来的皮肤病诊断算法在深肤色患者中很可能不准确。
今年9月,斯坦福大学皮肤病学临床学者RoxanaDaneshjou也曾发表一项研究,她发现大多数皮肤病诊断算法都没有提到所用数据集中种族或肤色的信息,同时,她也得出了和《柳叶刀》新论文类似的结论——算法对深肤色的代表性不足。
“最理想的情况是在临床问诊时注意肤色。”Daneshjou说。她建议在患者皮肤问题的图像进入数据库之前对其进行标记,这样可以方便研究人员开发算法,确保算法是用包含了不同皮肤类型的足够样本的数据集构建的。
《柳叶刀》最新的这篇论文提到了“健康数据贫困”这一概念,在人工智能+医疗领域,由于数据系统的差异,导致了不同年龄、性别、种族、社会经济地位的群体在医疗体系中存在实际的不平等。该论文强调,需要确保数据集的多样性、透明度和可用性。
Daneshjou也认为,应该提高数据集的透明度和清晰度,这将有利于发展更公平的人工智能工具。“我希望看到更多开放数据和更多标记良好的数据。”她说。
编译/综合:南都记者李娅宁