目前,各国报道的食管胃结合部腺癌(AEG)发病率
均呈一定上升趋势[1-3]
。中国、日本及其他亚洲国家亦有
类似的研究结果[4]
。因此,这类肿瘤引起了更多学者的
关注和重视。AEG 具有胃癌和食管癌的基本特性,但
又有所不同,其淋巴结转移即可上至胸腔纵膈又可下至腹腔,肿瘤位置处于食管胃交界处,手术难度大,操作复杂。临床外科对于该病手术的预后认知不足,且AEG 患者在临床病理分期、方案等方面存在不同,其预后差异很大。
Cox 比例风险回归模型(Cox-PH )通常用于队列研究[5],以确定风险因素,并使用生存数据构建预测模型。
Efficacy of machine learning models versus Cox regression model for predicting prognosis of esophagogastric junction adenocarcinoma
GAO Kaiji,WANG Yihao,CAO Haikun,JIA Jianguang
Department of Surgical Oncology,First Affiliated Hospital of Bengbu Medical College,Bengbu 233000,China
摘要:目的探讨机器学习和传统Cox 回归模型在预测食管胃结合部腺癌(AEG )患者术后生存能力中的应用价值。方法选取
2015年9月~2020年10月本院收治的287例AEG 患者,排除失访及临床资料缺失者,共筛选出203例患者的临床病理资料,经过对数据的赋值等处理,转换成满足R 语言分析数据的要求的数据。将203例患者数据使用随机数表法按照3∶1的比例划分为训练集和验证集,对两组数据分别进行Cox 比例风险模型构建和4种机器学习模型的构建,绘制出ROC 曲线、校准曲线和临床决策曲线(DCA )。为评估4种机器学习模型之间的预测效能,进行机器学习模型的内部验证。通过曲线下面积(AUC)评价模型预测的性能,校准曲线反映模型的拟合情况,并通过DAC 判断其临床意义。结果Cox 等比例风险回归、极端梯度提升、随机森林、支持向量机、多层感知机验证集中3年生存率的AUC 值分别为0.870、0.901、0.791、0.832、0.725,验证集中5年生存率的AUC 值分别为0.915、0.916、0.758、0.905、0.737。4种机器学
习模型内部验证分别是:极端梯度提升(AUC=0.818)、随机森林(AUC=0.772)、支持向量机(AUC=0.804)、多层感知机(AUC=0.745)。结论机器学习模型对于AEG 患者生存率预测的表现优于Cox 等比例风险回归模型,尤其在不满足等比例假设或线性回归模型下,并能够包含较多的影响变量。在内部验证中,XGBoost 模型的预测效能最好,支持向量机次之,随机森林出现过拟合,多层感知机受数据量影响可能拟合效果较差。关键词:食管胃结合腺癌;人工智能;机器学习;Cox 比例风险回归模型
Abstract:Objective To compare the performance of machine learning models and traditional Cox regression model in predicting postoperative outcomes of patients with esophagogastric junction adenocarcinoma (AEG).Methods This study was conducted among 203AEG patients with complete clinical and follow-up data,who were treated in our hospital between September,2015and October,2020.The clinicopathological data of the patients were processed for analysis using R language package and divided into training and validation datasets at the ratio of 3∶1.The Cox proportional hazards regression model and 4machine learning models were constructed for analyzing the datasets.ROC curves,calibration curves and clinical decision curves (DCA)were plotted.Internal validation of the machine learning models was performed to assess their predictive efficacy.The predictive performance of each model was evaluated by calculating the area under the curve (AUC),an
d the model fitting was assessed using the calibration curve.Results For predicting 3-year survival based on the validation dataset,the AUC was 0.870for Cox proportional hazard regression model,0.901for eXtreme Gradient Boosting (XGBoost),0.791for random forest,0.832for support vector machine,and 0.725for multilayer perceptron;For predicting 5-year survival,the AUCs of these models were 0.915,0.916,0.758,0.905,and 0.737,respectively.For internal validation,the AUCs of the 4machine learning models decreased in the order of XGBoost (0.818),random forest (0.758),support vector machine (0.0.804),and multilayer perceptron (0.745).Conclusion The machine learning models show better predictive efficacy for survival outcomes of patients with AEG than Cox proportional hazard regression model,especially when proportional odds assumption or linear regression models are not applicable.XGBoost models have better performance than the other machine learning models,and the multi-layer perception model may have poor fitting results for a limited data volume.
Keywords:esophagogastric junction adenocarcinoma;artificial intelligence;machine learning;Cox proportional hazard regression model
收稿日期:2022-11-12
基金项目:蚌埠医学院512人才培育计划(by51202207)
作者简介:高凯绩,在读硕士研究生,E-mail:*****************通信作者:贾建光,教授,硕士生导师,E-mail:Jiajianguang1978@126 doi 10.12122/j.issn.1673-4254.2023.06.10J South Med Univ,2023,43(6):952-963
·
·952
Cox-PH可以根据风险比值来定义变量的重要性,具有直观、解释性强的特点。然而,Cox-PH受到等比例风险和线性等假设的限制,若假设不满足则影响模型预测效果。此外,Cox-PH对于非线性复杂关系的变量难以处理[6]。机器学习(ML)是让计算机通过学习处理过的数据和信息,开发出一种算法,通过算法让机器学习如何做出决策。ML为通过经验自动改进的计算机算法[7],包括XGBoost、随机森林(RF)、支持向量机(SVM)、多层感知机(MLP)等,它们有能力从数据中学习训练以达到对未来事件的准确预测[8],这些算法正逐渐被用于肺癌、乳腺癌、肝癌、胃肠道癌等多种恶性肿瘤预后研究,成为临床研究的热点[9-12]。ML模型包含种类较多,且每种模型都具有自己的适用范围,不同种类、不同体量、不同特征的数据其预测效能也有所不同,传统的Cox-PH 和ML模型对AEG预后预测效能孰优孰劣尚未了解。因此,本文旨在构建Cox-PH和ML模型,比较两类模型对AEG患者生存的预测
效能。
1资料和方法
1.1资料收集
选取2015年9月~2020年10月蚌埠医学院第一附属医院收治的287例AEG患者。根据世界卫生组织将AEG定义为:肿瘤中心位于食管胃结合部(EGJ)上下5 cm范围内,且肿瘤本身必须跨越或者直接接触EGJ,病理为腺癌的肿瘤[13]。排除标准:不符合世界卫生组织对AEG定义的临床数据;临床资料不全者;合并有严重心肺功能疾病者;术后失访者;未经手术;死亡原因不明者。剔除后,共筛选出203例。采用电话随访的方法进行了为期5年的随访,时间截止2022年4月。
1.2数据处理
查阅相关文献,出可能影响AEG预后的相关因素,包括患者术前性别、年龄、Borrmann分型、分化程度、浸润深度(T分期)、淋巴结转移数量(N分期)、病理TNM分期、肿瘤最大直径、术后化疗、纤维蛋白原(Fibr)、D二聚体(D-dimer)、手术方式、术后住院时间、营养指数(PNI)、中性粒细胞计数与淋巴细胞计数的比值(NLR)、白球比(WBR)、血清癌胚抗原(CEA)、甲胎蛋白(AFP)、糖类抗原199(CA199)等,共19项观察指标。分析前因年龄、肿瘤大小、Fibr、D-dimer、PNI、术后住院时间
、NLR、WRB、CEA、AFP、CA199等11个连续性变量数值过多,容易造成模型过拟合,所以本研究采用X-tile3.6.1软件(耶鲁大学团队研发)[14],根据所需参数要求,对这11个连续变量取最佳截断值。将以上19项可能影响AEG预后的观察指标量化处理,转化成满足SPSS26.0、R4.2.2、Rstudio2022和python3.11.0处理的数据进行分析。
1.3训练集和验证集的划分
采用生存分析方法Kaplan-Meier法进行生存曲线绘制(图1),判断变量是否符合比例风险假设,并估计不同影响因素下AEG的生存率,使用Log-rank检验组间差异是否有统计学意义(表1)。在变量满足比例风险假设检验条件下,对变量进行单因素Cox回归分析,并对单因素分析中具有统计学意义(P<0.05)的变量进行分析,将其作为协变量纳入多因素Cox回归中,得到多因素分析中具有统计学意义(P<0.05)的变量(表2),将203例患者数据依据单因素Cox回归分析的变量使用随机数表法按照3∶1的比例分为训练集153例和验证集50例,卡方检验用于比较训练集和验证集之间的分类变量,连续性变量采用均数±标准差进行统计描述分析(表3)。
1.4模型构建
1.4.1Cox比例风险模型构建将训练集中Cox多因素分析有统计学意义的变量作为独立预后因素纳入构建Cox-PH。通过逐步回归法计算风险比率(HR)和95%可信区间(CI),并以列线图的形式显展示。根
据列线图(图2),计算训练集和验证集中各项得分总和得到总分,将总分按照列线图对应生存率,绘制出训练集和验证集3年和5年的ROC曲线、校正曲线以及临床决策曲线(DCA)(图3、图4和图7)。
1.4.2ML模型构建153例训练集数据用于建模,本研究基于Cox单因素分析中的13个变量(P<0.05)作为输入。在训练集中利用网格搜索方法确定XGBoost、随机森林(RF)、支持向量机(VM)、多层感知机(MLP)模型最优的超参数,逻辑回归采用默认参数。并使用5折重采样验证对模型进行训练和内部验证,最终得到最佳参数。各模型参数如下,XGBoost模型:优化目标函数使用二元logistic,学习速率设置为0.3,最大树深度设置为8;最小分叉权重和设置为4,L2正则化系数设置为1。RF模型:度量指标使用gini,最小分叉纯度收益设置为
0.0,树数目设置为100。SVM模型:正则化因子设置为
1.0,核类型使用rbf,收敛度量设置为0.1。MLP模型:输入层、隐藏层1、隐藏层2、输出层的节点分别设置为13、20、10、1,每一层运算方式都采用relu激活函数并随机初始化。训练次数为20次。经过多次训练计算出训练集中各模型3年和5年的AUC值,并在验证集中予以验证。为评估4种ML模型之间的预测效能,使用该4种ML模型对所有样本进行生存预测,在按照7:3比例随机划分独立训练集和验证集后,对训练集应用交叉验证进行超参数调优,充分利用训练集数据,避免测试集数据的泄露,同时在验证集中验证,统计各个模型在训练集和测试集上AUC表现。
1.5统计学方法
本研究连续变量使用X-til3.6.1进行最佳截断值选
www.j-smu J South Med Univ,2023,43(6):952-963·
·953
图119个变量的Kaplan-Meier 生存曲线
Fig.1Kaplan-Meier survival curves for the 19variables including age,gender,Borrmann staging,degree of differentiation,depth of infiltration (T stage),number of lymph node metastases (N stage),pathological TNM stage,maximum tumor diameter,postoperative chemotherapy,Fibr,D-dimer,surgical approach,postoperative hospital stay,PNI,NLR,WBR,CEA,AFP ,and CA199.Among them,gender,postoperative hospital stay and NLR did not meet the assumption of equal proportions.
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
40.0060.0080.00100.00
Survival time (month)
0.00
20.00
正则化的回归分析可以避免
40.0060.0080.00100.00
Survival time (month)
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
Survival functiona
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
1.00.8
0.60.40.20.0
C u m s u r v i v a l
J South Med Univ,2023,43(6):952-963www.j-smu
·
·954
表1Log-rank 检验
www.j-smu J South Med Univ,2023,43(6):952-963
·
·955
表2Cox 单因素、多因素分析
J South Med Univ,2023,43(6):952-963www.j-smu
·
·956

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。