通过ROC曲线、logistic回归筛选蛋白标志物,与临床病理变量进行组合构建了可以预测远端转移及生化复发的蛋白分类器模型,AUC值达到0.92。
基于蛋白组学的组织分类器对前列腺癌进展进行早期预测
一、研究背景
前列腺癌(PCa)是男性中最常见的癌症,尽管筛查中约40%的PCa是惰性的,但晚期PCa的5年生存率仅为29%。PCa具有复杂的疾病谱,从临床惰性到具有高度异质性的侵袭性亚型,因而临床上需要根据生物标志物和影像学检查来考虑疾病是否可能进展,当前的标准化(SOC)中基于血清PSA的前列腺癌筛查会导致较高的假阳性、活检并发症和过度诊断,最终导致过度。作者希望以蛋白组学研究来鉴定用于早期检测侵袭性PCa的蛋白标志物,以提高现有预后模型对患者进行风险分层的能力。
二、分析流程
三、结果解读
1.候选标志物的筛选
首先根据以下8个标准从现有PCa基因组数据集和PCa驱动基因集选出151个候选基因:
与正常对照相比,前列腺癌中表达差异显著;
受雄激素调节;
与前列腺癌预后有关;
与ETS家族转录因子有关;
通常在前列腺癌中重排;
参与前列腺癌细胞侵袭;
与多种恶性肿瘤有关;
可用于区分前列腺上皮和基质细胞。
对151个基因进行差异表达分析:使用NanoString技术定量PCa样本中的mRNA,进行PCa临床结果的差异mRNA分析。基于表达差异的显著性以及在福尔马林固定石蜡包埋(FFPE)
样本中检测蛋白质水平的可行性,选择其中的52个候选标志物进行蛋白组学分析。
2.构建PRISM-SRM方法及靶向蛋白组学测量
PRISM-SRM:具有智能选择和多路复用功能的高压,高分辨率分离与多重反应监测技术。
作者使用一种“智能”分级选择策略与LC-SRM联用,进行FFPE样本中目标蛋白的定量分析,实现更高的样品上样量、高效的肽富集以及样品复杂性的显著降低,从而提供了适合在宽浓度范围内检测候选蛋白标志物的高灵敏度分析法。
与检测21种蛋白的常规LC-SRM相比,PRISM-SRM方法可检测42种蛋白。
PCa样本:研究队列是来自Walter Reed National Military Medical Center (WRNMMC)前列腺癌生物标本库的338例在WRNMMC接受根治性前列腺癌切除术(RP)的PCa患者的FFPE组织。
PCa进展:以RP手术后的临床信息将患者分为生化复发(BCR)、远端转移(DM)和非事件(nonevents)三组。
bootstrap 5BCR事件定义:RP≥1年后生化复发,PSA水平连续≥0.2ng / mL(不包括RP后八周),或PSA水平≥0.2后开始挽救性放疗或激素。
DM事件定义:RP≥1年后转移,以影像学检查(包括骨扫描,CT扫描,MRI和/或骨活检结果)来确定。
nonevents定义:在研究结束时(至少有10年RP后随访),无BCR或DM证据。
52个候选蛋白中的10个由于检测灵敏度较差而被剔除,作者对42个蛋白在105例患者中进行初步分析,结果有16种蛋白质标志物在三个结果组(DM,BCR和无进展)中显示出表达量的显著差异,包括ANXA2,CAMKK2,CCND1,EGFR,pan-ERG,FOLH1,MMP9,MUC1,NCOA2,KLK3(PSA),SMAD4,SPINK1,SPARC,TFF3,TGFB1和VEGFA。
接着作者对PRISM-SRM方法进行改进,仅针对这16种蛋白质进行测量。
3.确定蛋白质标志物对前列腺癌进展的预测能力
表1展示338例PCa患者的临床信息及三个事件组间的差异。BCR和DM组临床特征和RP时病理特征均较差,包括较高的T stage,pT stage,Gleason分级,NCCN指南风险等级及RP手术切缘阳性。其中RP时GG4-5的患者在DM中占比91%,BCR中为64%,非事件组为39%(p <0.0001)。
作者分DM vs. Nonevent,BCR vs. Nonevent,GG (3–5 vs. 1–2) 三组对16种蛋白绘制了ROC曲线,表2展示了AUC值及p值。其中FOLH1, SPARC,TGFB1在三组中均具有显著的预测作用,PSA可预测DM,CAMKK2, EGFR, NCOA2可预测GG分级。
根据表2的结果,作者以具有显著意义的蛋白(DM 4种,BCR 3种)进行预测模型的构建。在两组标准化(SOC)变量模型的基础上加入蛋白标志物对DM与BCR绘制模型的ROC曲线:
图1比较了基础模型与加入蛋白标志物模型的AUC值,可以看到protein panel建模提高了基础模型的AUC值。
活检基础变量biopsy base model为一组PCa诊断时的临床变量,包括年龄、种族、NCCN指南的风险等级。
病理基础变量pathology base model为一组RP时检测的病理变量,包括pT stage、GG、手术切缘状态。
表3,4:确定每种蛋白的最佳临界值,保留可以同时达到70%的阴性预测值(NPV)和30%的特异性的高灵敏度的标志物。DM中四种蛋白均保留,BCR中仅保留SPARC和TGFB1两种蛋白。
使用表3,4中确定的蛋白临界值将样本分别分为高低表达组进行生存分析。
图3显示4种蛋白标志物均可以单独预测distant metastasis-free survival (DMFS),高水平FOLH1(p = 0.011),SPARC(p = <0.0001)和TGFB1(p <0.0001)患者预后较差,低水平PSA(p = 0.0104)患者预后较差。
图4显示高水平SPARC(p = 0.0011)和TGFB1(p = 0.0006)患者的BCR-free survival显著更差。
e survival生存曲线
4.预测远端转移的5蛋白分类器构建及验证
首先作者将214例患者(53 DM和161个非事件)随机分为训练和测试集(70%和30%)来构建预测DM的蛋白分类器。在训练和测试队列中,NCCN风险分级,病理性T分期,RP GG和手术切缘状态显示与远处转移密切相关。
在训练队列中使用单变量logistic回归分析来选择能显著预测DM的蛋白,结果包括CAMKK2,FOLH1,PSA,SPARC和TGFB1 5种蛋白。然后进行多变量logistic回归建模,使用bootstrap法重抽样获取95%置信区间,得到预测DM的最佳蛋白阈值为8.3,对应92%的NPV、90%的敏感性和53%的特异性。在训练集和测试集中5蛋白分类器的AUC分别为0.84和0.87。
最后作者进行多变量Cox回归分析构建预测DMFS的模型,分别组合活检变量(表5)和病理变量(表6)及5蛋白分类器,并且将5蛋白分类器在阈值(≥8.3 vs. <8.3)进行二分(model 1)或作为连续变量(model 2)构建了两种模型。
所有4个模型均满足每个协变量的比例风险假设。
在加入活检变量和二分类变量的模型中,蛋白分类器值高低组患者的DMFS具有显著差异(HR = 5.09,95%CI:1.11-23.4,p = 0.036)。
在连续变量模型中,蛋白质分类器值增加一个单位也可以显著预测DMFS(HR = 1.03,95%CI:1.02-1.05,p <0.001;HR = 1.02,95%CI:1.01-1.05,p = 0.018)。
同样通过在测试队列中将5蛋白分类器添加到活检和病理SOC变量中,对分类器进行多变量Cox回归建模以预测BCR。
最后作者绘制了基础模型、加入5蛋白分类器的模型、PSA单独诊断的ROC曲线,结果显示在预测DM(图A,B)中,加入蛋白分类器的活检模型AUC值由0.73提高到0.92,病理模型由0.83提高到0.94,而在预测BCR(图C,D)中,分别由0.71和0.78提高到0.88和0.90。以上,5蛋白分类器的加入显著提高了目前SOC模型的预测效果,活检模型预测能力的显著提高有助于前列腺癌进展的早期预测,减少对RP的需求。
小结
本篇文章着眼于开发PCa蛋白标志物,以提高现有标准化的RP后DM、BCR预测准确性。作者在PCa相关基因集中筛选出候选基因,对338例接受RP的PCa患者FFPE样本进行分析,使用NanoString进行初步的差异表达基因筛选,使用PRISM-SRM法进行蛋白定量,
选出16个候选蛋白标志物。接着分别组合PCa诊断时活检变量、RP组织病理变量,进行DM、BCR预测模型的ROC曲线绘制,并且对每种蛋白高低表达组进行了生存分析以确定蛋白对PCa进展的预测作用。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。