随着抗 PD-1/PD-L1 抗体在肿瘤中的广泛应用,免疫药物不同于细胞毒药物的不典型反应已经难以用传统的 RECIST V.1.1 评估,新的反应评估标准 ——iRECIST 应运而生。然而,iRECIST 和 RECIST 标准评估的临床试验终点是否一致?短期与长期终点的相关性如何?iRECIST 是否确实可以更好评价患者获益和给予更多患者免疫获益的机会?这些问题仍有待于更多临床证据来验证解答。
今天跟大家分享的是《肿瘤免疫治疗杂志》(J Immunother Cancer)上的回顾性分析。研究列举了 14 项提交至美国 FDA 的免疫治疗随机对照研究,对 iRECIST 和 RECIST V.1.1 评估的终点进行了对比。我们今天就一起梳理一下这两个评价体系的差异吧。
评估肿瘤疗效的标准在逐渐发展,以改进评估准确性并同时限制经济等负担。第一个被广泛接受的二维标准是世界卫生组织(World Health Organization, WHO)反应标准(1981 年),其在 2000 年被一维的实体肿瘤反应评估标准(Response Evaluation Criteria in Solid Tumours, RECIST)所替代。目前被广泛使用的反应评估标准是 RECIST V.1.1。临床研究中,公认反应评估标准(如 RECIST V.1.1)评估的客观反应率(Objective Response Rate,ORR),最佳总反应(Best Overall Response,BOR),反应持续时间(Duration of Response,DOR)和无进展生存时间(Progression-Free Survival,PFS)可作为有效的肿瘤负荷改变的终点,以描述治疗反应。但是,RECIST V.1.1 不能准确描述伊匹木单抗或抗 PD-1/PD-L1 抗体的非典型反应模式。这些非典型反应包括肿瘤负荷最初增大、之后减小(肿瘤复燃/假性进展),或肿瘤体积最初减小,但是出现了新病灶,而新病灶最终消退等。为了准确评估不典型肿瘤反应,研究者提出了 iRECIST 等免疫为基础的评估指标[1](表 1)。表 1:RECIST 1.1 和 iRECIST 对比
iRECIST 等免疫反应标准正在越来越多地应用于肿瘤免疫试验中,然而这些新反应标准是否可以更好评估接受免疫治疗患者的反应仍是未知。此外,由于 PFS 等结局指标可以比总生存期(Overall Survival, OS)更早地评估药物疗效,而且这些终点不被后续治疗方案交叉所混杂,美国食品药品监督管理局(Food and Drug Administration,FDA)也在考虑用这些指标替代 OS,以保证安全性有效的新型治疗可以尽快用于患者。J Immunother Cancer 上发表的一项研究就试图探索这些问题[2]。研究回顾性分析了 14 项评估免疫治疗疗效和安全性的随机对照研究(Randomized Controlled Trials, RCT),所有研究都是 2014.9~2017.9 期间提交到 FDA,且要求患者在最初的 RECIST V.1.1 定义的进展后有继续接受治疗的潜在机会。研究的瘤种包括黑色素瘤,鳞状/非鳞非小细胞肺癌(Non-Small Cell Lung Cancer, NSCLC),肾细胞癌(Renal Cell Carcinoma, RCC)和头颈部鳞状细胞癌(Head and Neck SquamousCell Carcinoma, HNSCC)。ORR 定义为达到 iRECIST 或 RECIST V.1.1 的完全缓解(Complete Response, iCR/CR)或部分缓解(Partial Response, iPR/PR)的患者比例。iBOR/BOR 定义为接受非试验方案治疗前,RECISTV.1.1 疾病进展(Progression of Disease, PD)前或 iRECIST 确认疾病进展(Confirmed Progressionof Disease, iCPD)前任何评估时间点的单次最佳反应状态。根据 iRECIST,在最初未确认的疾病进展(Unconfirmed Progression of Disease, iUPD)后达到疾病稳定(Stable Disease, iSD)或更好的患者需要在 iUPD 后评估 iCR/iPR/iSD 来确定 iBOR。OS 和 PFS 的分析是基于意向治疗(Intent-To-Treat, ITT)人群。OS 指从随机到死亡的时间。PFS(iRECIST 的 iPFS 和 RECIST V.1.1 的 PFS)指从随机到 iRECIST/RECIST V.1.1 的 PD 或死亡的时间。分析 iPFS 时,最早的 iUPD 的后续确认即为进展日期(也就是后续 iUPD 确认而没有插入 iSD,iPR 或 iCR 确认)。在 8170 名随机患者中,4802 名(59%)接受抗 PD-1/PD-L1 抗体,642 名(8%)接受抗 CTLA-4 抗体,2728 名(33%)接受化疗。7920 名接受治疗的患者人群包括 4751 名(60%)接受抗 PD-1/PD-L1 抗体治疗患者,613 名(8%)接受抗 CTLA-4 抗体治疗患者,和 2556 名(32%)接受化疗的患者。ORR 差异仅 1%,2.8% 患者在 RECIST V.1.1 PD 后有获益接受抗 PD-1/PD-L1 抗体治疗的患者,iRECIST 评估的 ORR 是 31.5%,RECIST 评估的 ORR 是 30.5%,ORR 差异是 1%。接受抗 CTLA-4 抗体治疗(19.7% vs 19.2%)或化疗(15.2% vs 15%)的患者 iRECIST 和 RECIST 评估的 ORR 差异更小。4751 名接受抗 PD-1/PD-L1 抗体治疗的患者中,有 232 名(4.9%)在 RECIST V.1.1 定义的 PD 后达到 iCR 或 iPR(n = 133[2.8%])或 iSD(n = 99[2.1%])。这 133 名 iPR/iCR 患者中,85 名(64%)在 RECIST V.1.1 定义的 PD 前也达到了 CR 或 PR,而 48 名(36%)患者 SD(n = 11)或 PD(n = 37)为其 RECIST V.1.1 最佳反应(也就是说只有 iRECIST 评估的反应)。所有 iRECIST 评估反应的患者中位 DOR 是 10.1 个月(范围:0-33.4),而 RECIST V.1.1 评估反应的中位 DOR 是 9.2 个月(范围:0-33.3)。138 名不同反应标准评估 DOR 不同的患者,中位 iDOR 是 14.1 个月(范围:0-33.4),中位 DOR 是 6.1 个月(范围:0.9-24.9)。37 名 iRECIST 反应而 RECIST V.1.1 评估的 BOR 为 PD 的患者,RECIST V.1.1 评估的 PD 证据是:57% 的患者病灶增大(11 名患者靶病灶增大 [30%];9 名患者非靶病灶增大 [24%];1 名患者非靶病灶增大和新病灶出现 [3%]),43% 出现新病灶。蜘蛛图总结了不同进展情况肿瘤负荷随时间的改变(图 1)。如图所示,所有 PD 事件都发生在开始治疗的 14 天内,中位 iUPD 时间为 8 周(最小,最大:1,14)。图 1:37 名 RECIST V.1.1 评估 PD 而 iRECIST 评估为 iCR/iPR 患者的蜘蛛图。(A)11 名靶病灶 RECIST V.1.1 PD 的反应患者;(B),10 名非靶病灶 RECIST V.1.1 PD 的反应患者;(C),16 名出现新病灶的患者。黑圈即为 RECISTV.1.1 PD 时间。(来源 DOI:10.1136/jitc-2019-000146)PFS 分析中,62% 接受抗 PD-1/PD-L1 抗体治疗的患者为 RECIST V.1.1 PD,59% 为 iRECIST PD。2832 名 iRECIST PD 的患者,61% 在 RECIST PD 是视为 iUPD,之后未再行疾病评估,18% iUPD 的患者接受了之后的疾病评估没有确认 PD(也就是未达到 iCPD);21% 之后确认为 iCPD。232 名 RECIST V.1.1 评估为 PD 的患者在之后的时间点评估为 iSD/iPR/iCR,因此具有了更长的 iPFS 持续时间。iRECIST 确认反应的亚组中,中位 iPFS 和中位 PFS 持续时间分别是 18.7 个月(最小,最大:1.3,36.1)和 5.4 个月(95% CI 4.0-6.2),iRECIST 评估为之后 PD 的亚组中,中位 iPFS 和中位 PFS 持续时间分别是 10.1 个月(95% CI 8.4-10.9)和 2.8 个月(95% CI 2.6-4.1)。总的 PFS 分析,推测中位 iPFS 是 4.2 个月(95% CI 4.0-4.4),推测中位 PFS 是 3.9 个月(95% CI 3.6-4.1)(图 2)。图 2:232 名 RECIST V.1.1 PD 后患者 iRECIST 状态(SD 或更好)的游泳图。(A)116 名患者在 RECIST V.1.1 PD 后继续反应。(B)116 名患者在 RECIST V.1.1 PD 后进展/死亡。(来源 DOI:10.1136/jitc-2019-000146)iRECIST 评估反应的患者和 RECIST V.1.1 达到 PR 或 CR 的患者似乎只有在开始阶段具有相似的生存。而在抗 PD-1/PD-L1 抗体治疗组,RECIST V.1.1 PD 后达到 iSD 的患者和 RECIST SD 的患者在开始阶段具有相同的生存,而在后面的时间点两条曲线分开。仅为 iSD 患者的推测中位 OS 是 12.1 个月(95% CI 8.9-未达到 [not reached, NR]),RECIST V.1.1 SD 患者的推测中位 OS 是 16.2 个月 (95% CI 14.9-18.2)(图 3)。图 3:(A)所有 8170 名随机患者根据 BOR 的 OS。(B)接受抗 PD-1/PD-L1 抗体治疗患者的 OS。(来源 DOI:10.1136/jitc-2019-000146) 为明确 PFS(RECIST V.1.1)和 iPFS(iRECIST)是否可以作为 OS 的替代终点,研究还分析了 PFS/iPFS 与 OS 的相关性。结果证实,PFS 和 iPFS 与 OS 的相关性一般。和 PFS 和 OS 的相关性相比,iPFS 和 OS 相关性的 R2 值略有增加(R2 = 0.277 vs R2 = 0.260)。在肿瘤免疫治疗中,由于常有不典型反应发生,使用常规标准评估的 ORR 被认为低估了 15%[3]。。因此,使用免疫为基础的反应评估标准就引起了研究者的浓厚兴趣。本研究纳入了 14 个临床试验,数据庞大,结果发现 iRECIST 评估的 ORR 和 RECIST V.1.1 评估的 ORR 类似(31.5% vs 30.5%),在各瘤种中一致。接受抗 PD-1/PD-L1 抗体治疗的患者在 RECIST V.1.1 PD 后有 2.8% 达到 iCR 或 iPR,这包括了大约 1% 早期 RECIST V.1.1 PD 的患者,但是后续具有持续的肿瘤反应,可以从免疫治疗中获益。此外,部分 RECIST V.1.1 反应的患者在 iUPD 后确认为 iSD,因此增加了反应持续时间。总的说来,iRECIST 评估的持续反应导致中位 DOR 更长,在总的分析人群中差异一般(大约 1 个月),但是在特异性治疗如抗 CTLA-4 抗体亚组中(使用 iRECIST 评估中位 DOR 增加了大约 3 个月)具有潜在的意义。因此,RECIST V.1.1 似乎可以捕捉到抗 PD-1/PD-L1 抗体治疗的大部分治疗效应,但是确实可能导致部分患者有效治疗的早期终止,而这部分患者最终和 RECIST V.1.1 评估的反应者生存延长类似。一些初始进展之后疾病稳定的患者被 RECIST 认为是早期进展,而 iRECIST 评估为延长的 SD,因此改善了 PFS 和 OS 的相关性。在抗 PD-1/PD-L1 抗体治疗患者中,推测中位 iPFS 是 4.2 个月,而 RECIST V.1.1 推测中位 PFS 是 3.9 个月。因此,iPFS 和 OS 的相关性以及 PFS 和 OS 的相关性较弱且二者类似。因此,当评估免疫治疗中 iPFS 或 PFS 作为 OS 的替代终点时,由于 R2 值差异细微,因此结论受限。虽然这个分析包括了很多研究和患者数据,但是其结论还是被回顾性研究的性质和研究没有根据 iRECIST 标准进行而限制。非靶病灶不能充分记录,新病灶未行持续测量,以及临床实际中患者在 iCPD 前即停止用药,RECIST V.1.1 PD 后未再行肿瘤评估等行为,都有可能影响到结果。iRECIST 已经获得了越来越广泛的接受。前瞻性地应用 iRECIST 来确定首要终点、试验设计、研究进行和分析计划时,需要明确使用 iRECIST 带来的潜在偏倚并使之最小化。免疫相关研究中使用同一评估标准有助于临床研究中数据收集和评估的一体化。[1] Seymour L et al.iRECIST: guidelines for response criteria for use in trials testingimmunotherapeutics. Lancet Oncol. 2017 Mar;18(3):e143-e152.[2] Mulkey F et al.Comparison of iRECIST versus RECIST V.1.1 in patients treated with an anti-PD-1or PD-L1 antibody: pooled FDA analysis. J Immunother Cancer. 2020Feb;8(1):e000146[3] Queirolo P, SpagnoloF. Atypical responses in patients with advanced melanoma, lung cancer,renal-cell carcinoma and other solid tumors treated with anti-PD-1 drugs: asystematic review. Cancer Treat Rev 2017;59:71-8.