【Cell子刊】深圳湾实验室孙坤团队新突破:游离DNA末端特性开辟癌症精准诊断新纪元

图片

【导读】血浆中游离DNA(cfDNA)的片段化模式,可能用作液体活检中的诊断生物标志物。然而,科学界对这种生物过程和以碎片模式编码的信息的了解,仍然是初步的。在这项研究中,团队研究了造血细胞中针对核小体定位模式的cfDNA片段组学特征。

2024年10月14日, 深圳湾实验室肿瘤研究所孙坤团队在期刊《Cell Reports Methods》上发表了题为“Cell-free DNA end characteristics enable accurate and sensitive cancer diagnosis”的研究论文。在这项研究中,团队在末端选择后,开发了3个cfDNA片段组学指标。通过结合机器学习,团队进一步构建了高性能诊断模型,在特异性为95%的情况下,曲线下总面积为0.95,灵敏度为85.1%。这项研究探讨了cfDNA片段组学的最终特征及其在构建准确和灵敏的癌症诊断模型方面的优点。

图片

关于血浆循环游离DNA

 01 

血浆循环游离DNA(cfDNA)是一种经过深入研究的分析物,用于无创产前检测、癌症诊断和治疗监测(即“癌症液体活检”)。研究人员发现,cfDNA分子是通过与其起源组织高度相关的非随机程序产生的。在最近的一项研究中,Cristiano等人表明,通过将cfDNA片段组学特征与机器学习方法相结合,可以获得高性能的诊断模型。


在以前的研究中,团队和其他人证明,cfDNA的片段化与核小体结构密切相关。此外,团队发现,癌症患者的总体cfDNA终结谱与对照受试者显著不同,并进一步开发了基于终结的指标E指数,用于癌症诊断。在这项研究中,团队研究了cfDNA相对于核小体的特征(来源于造血细胞或直接从cfDNA覆盖模式推断),以进一步探索cfDNA片段组学的生物学特性及其翻译价值。

图片

图形摘要

末端选择的cfDNA片段组学特征

 02 

末端选择后,cfDNA的总体大小分布与未进行末端选择后相似。例如,在166bp处出现峰值,在143bp以下有10bp的周期性,被保存下来;然而,不大于150bp的片段的比例增加,具有CCCA末端基序的读数比例也显著增加。


肿瘤来源的cfDNA分子确实富含末端选择。仅基于5'末端的末端选择或使用补充核小体轨道,显示出一致的结果。

图片

 末端选择的cfDNA片段组学的改变

通过机器学习提高诊断性能

 03 

对于每个样本,团队计算了每个窗口的N指数值,然后采用梯度提升决策树(GBDT)算法,利用N指数值来区分癌症患者和对照组。团队将这种方法命名为EXCEL(末端选择检查cfDNA),它生成了带有分数的模型,以对样本是否癌变进行分类。每5Mb窗口N指数值的EXCEL模型显示,总体AUC值为0.95,并且显著高于全基因组N指数指标。所有癌症和分期的AUC,至少为0.92。此外,EXCEL在181名癌症患者中,检测到154名患者敏感性为85.1%,特异性为95%,高于同一数据集上的DELFI算法(79.8%);同样,对可切除(I-III 期)肿瘤患者的敏感性为84.8%,也高于DELFI(79.2%)。在区分癌症样本与对照组时,总体AUC值分别为0.88和0.81,这明显高于没有使用机器学习的全基因组指标。

图片

使用EXCEL进行癌症诊断

总结

 04 

1. N指数值的意义:N指数值反映了肿瘤DNA分数的升高,表明末端选择可以富集肿瘤来源的cfDNA。


2. 生物标志物的潜力:N指数、ΔS150值和ΔMCCCA指标,是泛癌诊断的有前途的生物标志物。


3. 末端选择的重要性:末端选择可以富集肿瘤来源的cfDNA分子,恢复大量读数用于下游分析。


4. 诊断性能的提升:结合机器学习方法,这些指标可以显著提高泛癌患者的诊断性能。


5. 未来应用的展望:这些指标可以作为构建大型多生物标志物、高性能诊断模型的宝贵元素。


参考资料:


1.Wan, J.C.M. ∙ Massie, C. ∙ Garcia-Corbacho, J. ...

Liquid biopsies come of age: towards implementation of circulating tumour DNA

Nat. Rev. Cancer. 2017; 17:223-238


2.Lo, Y.M.D. ∙ Han, D.S.C. ∙ Jiang, P. ...

Epigenetics, fragmentomics, and topology of cell-free DNA in liquid biopsies


【关于投稿】

图片

点击对应文字 查看详情