2024年9月,四川大学华西医院呼吸与危重症医学科李为民教授、王成弟研究员团队在医学顶级期刊Nature Medicine(IF:58.7)发表了最新研究成果“Data-driven risk stratification and precision management of pulmonary nodules detected on chest computed tomography”。基于中国人群肺癌筛查队列、肺结节临床队列,创新性研发基于数据驱动的中国肺结节报告和数据系统(Chinese Lung Nodules Reporting and Data System, C-Lung-RADS),实现了肺结节恶性风险精准分级和个性化管理。
肺癌位居我国恶性肿瘤发病率、死亡率首位,早期肺癌可以实现治愈,而晚期肺癌患者的五年生存率极低,早诊早治是提高生存率的关键。低剂量螺旋CT(Low-dose Computed Tomography,LDCT)是肺癌筛查、诊断的重要辅助工具,随着LDCT的广泛应用,肺结节检出率逐年增高。如何识别有重要临床意义的肺结节,同时防止过度外科治疗是肺癌筛查过程中的重要挑战。现有肺结节分级标准主要包括美国放射学会提出的Lung-RADS,通过影像信息进行肺结节分类,在中国人群的筛查效能较低。基于此,本研究基于真实世界肺结节数据,创新阶梯式C-Lung-RADS系统,智能评估肺结节的恶性风险等级(低危、中危、高危、极高危)。该系统在第一阶段(Phase 1)自动检出肺结节,利用决策树分类模型,根据密度和大小对肺结节进行初步风险分级;第二阶段(Phase 2)融合影像、临床等信息,精确诊断高危肺结节;第三阶段(Phase 2+),进一步纳入随访结果,建立多模态融合模型,确定极高危肺结节。并针对不同恶性风险等级的结节制定个性化随访及决策建议,以确保医疗资源合理分配,避免低危患者过度诊疗、极高危患者漏诊误诊。
图2 C-Lung-RADS肺结节风险分级及精准管理策略
该研究基于四川大学华西医院及其医联体12万受试者开展,纳入胸部CT检查检出肺结节患者,其中健康体检队列(Medical Checkup Cohort,MCC)45064例肺结节患者数据作为训练集(80%)和内部测试集(20%),社区筛查队列(Mobile Screening Cohort,MSC)14437例肺结节患者数据数据作为外部测试集。
C-Lung-RADS第一阶段Phase1使用肺结节的密度类型、大小以及部分实性结节的实性成分比例作为决策树模型的输入,通过对每个分裂节点进行分析,提取出相应的直径阈值作为候选指标。随后,将这些基于不同密度类型所获得的阈值进行整合,并通过网格搜索技术,在群体水平上确定不同密度类型结节四种恶性风险分级的最优的阈值组合,以实现最佳的区分效能,进而为每个结节分配特定的风险级别。对于实性结节,恶性风险分级的大小阈值为6、10和18 mm;对于纯磨玻璃结节,低、中、高危的大小阈值分别为6和20 mm;对于部分实性结节,其阈值是根据结节大小(6 mm)和实性成分直径(6和10 mm)来确定。相较于Lung-RADS中的大小界值,C-Lung-RADS的结节直径大小阈值更加适合中国人群(受试者工作特征曲线下面积AUC分别为0.761,0.899),为大规模肺癌筛查中肺结节的风险分类提供科学依据。
图3 Phase1基于决策树模型确定结节风险分层的大小阈值
为了进一步区别高危结节、极高危结节,Phase2/2+阶段创新深度卷积神经网络(Deep Convolution Neural Network, DCNN),并融合影像、临床及随访信息进行多维梯度提升回归(Gradient Boosting Regression, GBR),生成肺结节恶性概率,并与结节风险类型相关联。当恶性概率低于0.5时被预测为良性并保留原有风险级别;反之则被视为可疑恶性且风险等级为极高危,实现风险分级的增强优化。在内部测试集中,多维度模型(影像+临床+随访)的AUC为0.918(95%置信区间[CI]: 0.917-0.919),高于双维度模型(影像+临床,AUC=0.882,95% CI: 0.881-0.883)和单维度模型(影像,AUC=0.881,95% CI: 0.880-0.882)。在独立验证集中多模态模型的诊断效能也是最佳(AUC=0.927,95% CI: 0.926-0.928)。这些不同模式的医疗数据从不同角度提供了患者信息,既有信息重叠,又有信息互补,实现早期肺癌的精准诊断。
图4 Phase 2/2+多维梯度提升回归模型在恶性肺结节的诊断性能
最终,C-Lung-RADS系统整合了第一阶段决策树的初步分级、第二阶段DCNN模型和GBR模型输出的恶性概率,综合评估肺结节风险分级,并提供相应的随访及决策建议。在内部测试集中,C-Lung-RADS诊断恶性肺结节的灵敏度为79.9%,明显高于Lung-RADS的60.3%,在阳性预测值相当的情况下,C-Lung-RADS阴性预测值显著高于Lung-RADS v2022(96.1% vs 92.9%)。同样在独立测试集中,C-Lung-RADS鉴别高危肺结节的灵敏度为87.1%,优于Lung-RADS 63.3%,在阳性预测值相当的情况下,C-Lung-RADS阴性预测值显著高于Lung-RADS v2022(99.0% vs 97.1%)。证实肺癌筛查场景中,C-Lung-RADS较Lung-RADS更适用于中国人群肺结节的风险分层。根据现行指南、专家共识和医生临床经验,C-Lung-RADS建议对低危结节进行年度LDCT随访;对中危和高危结节分别进行6个月和3个月CT随访;对于极高危结节,建议进行多学科讨论并立即临床干预。
表1 C-Lung-RADS肺结节风险分级和精准管理策略
本研究创新性构建了适合中国人群的肺结节风险分级系统C-Lung-RADS,主要创新点在于:
(1)大数据:构建了中国人群肺癌筛查队列、肺结节临床研究队列,涵盖约6万例肺结节患者,为模型构建奠定了坚实的数据基础;
(2)阶梯式:创新多阶段评估的肺结节风险分级方案,通过临床简便易行的方法识别出大量低危结节(占比约78.2%),着重分析风险程度高的结节(占比约21.8%),进一步筛查出极高危肺结节(占比约1.9%),优化了医疗资源分配;
(3)多维度:开发多维梯度提升回归模型整合影像、临床、随访信息,准确鉴别恶性结节,更加符合临床应用场景;
(4)可及性高:目前搭载C-Lung-RADS AI软件的智慧健康管理车已在四川广安、甘孜等地成功应用,突破地域限制,提高肺癌筛查的可及率,将优质的医疗资源送入千家万户。
C-Lung-RADS肺结节风险分级及精准管理策略的提出,为中国肺结节人群的诊疗提供了科学指导:对于低危结节,优化随访频率,避免过度诊疗;对于高危结节,制定最佳随访间隔时间,通过多维度数据融合评估精准识别极高危结节,提高早期肺癌诊断率,在肺癌“治愈窗口期”进行干预,达到治愈效果。推动肺癌早筛早诊关口前移,提高肺癌早期诊断率和五年生存率,助推健康中国建设。
图5 C-Lung-RADS联合车载CT设备开展肺癌筛查的应用案例
第一作者和通讯作者单位:
四川大学华西医院
共同通讯作者:
四川大学华西医院呼吸与危重症医学科李为民教授、王成弟研究员、联影智能石峰研究员、上海科技大学沈定刚教授
本文共同第一作者:
四川大学华西医院呼吸与危重症医学科王成弟研究员、呼吸病学博士生邵俊、联影智能贺怿楚博士
该研究得到国家自然科学基金委项目等资助支持。
排版:张晶
编辑:张晶
目前1600000+医生已关注加入我们