桥本甲状腺炎性结节与甲状腺微小乳头状癌鉴别诊断:基于MRI影像组学机器学习的应用
王庆军1,程流泉1,符永瑰1,梁晓晶1,洪柳2,李梦露1*
1.解放军总医院第六医学中心放射诊断科,北京100048;
2.解放军总医院第六医学中心病理科,北京100048;*通信作者李梦露
【基金项目】2021年北京市海淀区卫生健康发展科研培育计划立项项目(HP2021-32-80501)
【摘要】目的研究基于甲状腺MRI多序列图像影像组学机器学习分类诊断模型鉴别诊断桥本甲状腺炎性结节与甲状腺微小乳头状癌的价值。资料与方法回顾性纳入2015年6月—2022年4月于解放军总医院第六医学中心行MRI检查并经病理证实的114个桥本甲状腺炎性结节和76个甲状腺微小乳头状癌,MRI检查序列包括T1WI、T2WI、扩散加权成像(b=0、800、2 000 s/mm2)、表观扩散系数和增强扫描T1WI。基于MRI图像对两组病灶进行分割、配准、影像组学特征提取和特征选择,经有监督机器学习建立并超参数调优6个常用的单模型分类诊断模型:逻辑回归、线性判别分析、支持向量机、K邻近算法、高斯朴素贝叶斯和分类回归树,比较6个分类模型对两组病变的鉴别诊断能力。结果每个序列图像提取960个特征,共提取6 720个影像组学特征,最终经特征选择筛选出30个表观扩散系数原始图像形状和一阶统计量特征。在6个分类诊断模型中,支持向量机和逻辑回归模型鉴别桥本甲状腺炎性结节和甲状腺微小乳头状癌的效果最优,曲线下面积均为0.97。结论基于甲状腺MRI影像组学机器学习分类模型鉴别诊断桥本甲状腺炎性结节与甲状腺微小乳头状癌具有一定的应用价值。
【关键词】甲状腺炎;甲状腺癌,乳头状;磁共振成像;影像组学;机器学习;诊断,鉴别
【中图分类号】R445.2;R736.1;R581.4 【DOI】10.3969/j.issn.1005-5185.2023.03.005
Differentiation Between Hashimoto's Thyroiditis Nodule and Papillary Thyroid Microcarcinoma: Application of MRI Radiomics-Based Machine Learning
WANG Qingjun1, CHENG Liuquan1, FU Yonggui1, LIANG Xiaojing1, HONG Liu2, LI Menglu1*
Department of Radiology, the 6th Medical Center of Chinese PLA General Hospital, Beijing 100048, China; *Address
【Abstract】Purpose To explore the diagnostic value of MRI multi-sequences radiomics-based machine learning in distinguishing Hashimoto's thyroiditis nodule from papillary thyroid microcarcinoma. Materials and Methods A total of 114 Hashimoto's thyroiditis nodules and 76 papillary thyroid microcarcinomas confirmed by pathology were retrospectively enrolled from June 2015 to April 2022 in the 6th Medical Center of Chinese PLA General Hospital. The MRI sequences included T1WI, T2WI, diffusion weighted imaging (b=0, 800 and 2 000 s/mm2), apparent diffusion coefficient and contrast-enhanced T1WI. Nodules were segmented, registered and radiomics features were extracted and selected. The frequently-used six single diagnostic models, including Logistic regression, linear discriminant analysis, support vector machine, K-nearest neighbors, Gaussian naive Bayes and classification and regression tree, were built and hyper-parameters were tuned based on th
e selected radiomic features by supervised machine learning. The ability of differential diagnosis for the two diseases was compared between the six models. Results A total of 6 720 radiomic features were extracted (960 features for each MRI sequence) and 30 features were finally selected. Among the six diagnostic models, the support vector machine and Logistic regression had the superior performance in classification between Hashimoto's thyroiditis nodules and papillary thyroid microcarcinomas with area under curve value of 0.97, respectively. Conclusion MRI radiomics-based machine learning has a certain application value for differentiating Hashimoto's thyroiditis nodules from papillary thyroid microcarcinomas in clinical practice.
【Key words】Thyroiditis; Thyroid cancer, papillary; Magnetic resonance imaging; Radiomics; Machine learning; Diagnosis, differential Chinese Journal of Medical Imaging, 2023, 31 (3): 213-219
甲状腺乳头状癌是最常见的甲状腺恶性肿瘤,约占90%[1]。WHO将直径≤1.0 cm的甲状腺乳头状癌定义为微小乳头状癌[2],随着人们对甲状腺疾病的重视和体检的普及,微小乳头状癌逐渐成为最常见的甲状腺恶性病变[3]。桥本甲状腺炎是由甲状腺自身免疫反应所致的慢性淋巴细胞炎性病变。桥本甲状腺炎性结节直径一般不超过1.0 cm[4]。目前超声是甲状腺结节的首选影像学检查,但由于桥本甲状腺炎性结节与甲状
腺微小乳头状癌的结节大小和声学表现有一定重叠,两者有时不易鉴别[5]。基于影像组学的机器学习方法可以充分挖掘医学影像数据潜在信息,从而提升良、恶性病变的鉴别诊断能力[6-7]。本研究拟使用甲状腺MRI多序列图像,基于影像组学特征和机器学习方法建立分类诊断模型,研究其鉴别桥本甲状腺炎性结节与甲状腺微小乳头状癌的价值。
1 资料与方法
1.1 研究对象回顾性纳入2015年6月—2022年4月于解放军总医院第六医学中心因甲状腺结节进行甲状腺MRI平扫及增强扫描的患者。纳入标准:①超声引导下穿刺活检或手术后病理证实为桥本甲状腺炎性结节或甲状腺微小乳头状癌;②穿刺活检或手术前1周内行甲状腺MRI平扫及增强扫描;③MRI显示的结节与病理结果匹配;④结节在扩散加权成像(DWI)图像上可以辨认;⑤若同一例患者存在多个同一性质的结节,则选取其中1个结节(轮廓最清晰的结节)。排除标准:①结节有穿刺活检、放疗、各种介入史;②结节直径≤
2.0 mm;③某个或多个序列成像图像质量差,结节无法辨认。
共纳入桥本甲状腺炎性结节118个、甲状腺微小乳头状癌78个。在结节特征值提取阶段,因特征值无法提取(提取程序提示病灶过小),排除4个桥本甲状腺炎性结节和2个甲状腺微小乳头状癌,最终纳入114例114个桥本甲状腺炎性结节和76例76个甲状腺微小乳头状癌,6例同时有桥本甲状腺炎性结节和甲状腺微小乳头状癌。桥本甲状腺炎性结节患者中,男15例,女99例,平均年龄(40.4±12.3)岁;甲状腺微小乳头状癌患者中,男18例,女58例,平均年龄(42.8±13.4)岁。本研究经本院医学伦理委员会批准(AF/SC-09/02.1),所有患者均签署知情同意书。
1.2 仪器与方法采用Siemens Skyra 3.0T MR扫描仪和8通道颈部专用表面线圈(上海辰光,CG-CTC18-
H300-AS)。检查序列包括横轴位脂肪抑制T1WI、横轴位脂肪抑制T2WI、横轴位脂肪抑制DWI、增强扫描横轴位脂肪抑制T1WI。以上检查序列均为二维成像。DWI使用多次激发分段读出长可变回波链技术。扫描参数:T1WI:TR 1 490 ms,TE 13 ms,视野160 mm,矩阵256×320。T2WI:TR 3 420 ms,TE 87 ms,视野160 mm,矩阵256×320。DWI主要扫描参数:TR 7 310 ms,TE 69 ms,视野175 mm,矩阵160×112。层厚均为3.0 mm,层间距均为0.3 mm,层数均为24层。DWI的3个b值分别为0、800、2 000 s/mm2,对应的激励次数分别为1、1、4。表观扩散系数(ADC)图像基于上述3个b值主机自动在线计算生成。共有7套原始图像:T1WI,T2WI,b值分别为0、800、2 000 s/mm2的DWI,ADC,增强扫描T1WI。鉴于多b值DWI图像的潜在价值,3个b值的DWI图像均作为原始图像进行分析使用。
1.3 桥本甲状腺炎性结节与甲状腺微小乳头状癌的病理匹配若超声引导下穿刺活检证实为桥本甲状腺炎性结节,则不再行甲状腺手术,由实施活检的超声医师记录桥本甲状腺炎性结节部位(上下、内外、与包膜距离等)及最大径。若结节进行手术切除(无论术前是否行穿刺活检),由手术医师记录结节部位,由病理医师记录最大径。2名放射科主治医师采用盲法依据超声医师或手术医师及病理医师记录的结节部位和大小,共同确定结节在MRI图像中的对应位置。
1.4 图像处理与分析
1.4.1 图像预处理根据IBSI规范对图像进行预处理[8]。首先对所有图像进行高斯平滑处理,按照常规将平滑系数Sigma设置为1.0。然后进行N4偏置场校正和图像方向调整,图像方向统一调整为RPI(right posterior inferior)。以上图像预处理均使用SimpleITK (
2.2.0.dev)模块完成。
1.4.2 结节分割2名放射科主治医师采用盲法,基于记录的MRI图像中的结节,使用3D-Slicer(4.11.20210226)软件,参照T1WI、T2WI、b=800 s/mm2 DWI等图像,以b=2 000 s/mm2 DWI图像为基础进行结节手动分割。分割结节时,其中1名放射科医师负责操作,逐层勾画结节轮廓,另1名放射科医师监督,2名医师对结节轮廓取得一致意见后进行下一层面结节勾画。
1.4.3 结节多序列图像配准与校正以b=2 000 s/mm2的DWI图像作为配准图像,其余序列图像作为固定图像,将配准图像配准到固定图像,并获取转换矩阵,然后将mask图像配准到其他序列图像上。由上述2名放射科医师再次使用3D-Slicer软件,参考b=2 000 s/mm2的DWI图像,查看每个序列配准后图像结节勾画情况,如果配准不佳,则进行手动校正调整。
1.4.4 影像组学特征提取基于Pyradiomics(3.0.1)以及IBSI规范提取影像组学特征[8]。原始图像影像组学特征包括6大类100个:形状特征14个、一阶统计量特征18个、灰度共生矩阵特征22个、灰度行程矩阵特征16个、灰度区域大小矩阵特征16个、灰度相关矩阵
特征14个。除形态特征外,其余特征使用高斯滤波以及高通、低通滤波所有组合的小波变换。每个结节每套图像提取960个特征,每个结节7套图像共提取6 720个影像组学特征。
1.4.5 影像组学特征预处理及特征选择 对提取的影像组学特征数据首先去除稀疏数据、查看并处理缺失
值(以特征平均值填充)。特征选择基于2步:①引入并使用特征选择工具类(FeatureSelector )进行初步特征选择(github/WillKoehrsen/feature-selector )。②使用带有L1正则化的线性逻辑回归(Logistic regression ,LR )模型进行特征选择,即LASSO 回归特征选择。在进行LASSO 回归特征选择前,首先将两组病例按照8∶2分为训练集和测试集数据,对数据进行标准化(z-score )和离散处理。以网格搜索的方式,对带有L1正则化的线性LR 模型超参数调优,以确定最佳逆正则化系数C 值。
1.4.6 构建分类诊断模型及超参数调优 基于训练集数据及所选特征,构建6种分类诊断模型,除LR 模型外,还有线性判别分析(linear discriminant analysis ,LDA )、支持向量机(support vector machine ,SVM )、K 邻近算法(K-nearest neighbors ,KNN )、高斯朴素贝叶斯(Gaussian naive Bayes ,GNB )、分类回归树(classification and regression tree ,CART )。首先基于训练集数据、所选特征和各模型默认超参数,使用K 折交叉验证(K=10)方法,以分类准确性为衡量指
标,初步比较各模型对两组病变的分类诊断能力。然后基于训练集数据,以网格搜索的方法对各模型进行超参数调优。
1.4.7 各模型分类诊断性能 基于训练集数据及所选特征,以分类准确性为评估指标,了解各模型超参数调优后分类诊断性能变化。基于测试集数据及所选特征,获取各模型分类报告、受试者工作特征(ROC )曲线和曲线下面积(AUC ),并两两比较各模型ROC 曲线。
1.5 统计学方法 基于PyCharm (2021.1专业版)编译器,使用Python 3.8进行代码书写及程序运行。除甲状腺结节多序列图像配准使用ANTsPy 模块基于Linux 操作系统完成外,其余均基于Windows 操作系统完成。计量资料以 x ±s 表示,组间比较采用t 检验。采用ROC 曲线分析各模型的诊断性能,各分类诊断模型
的AUC 两两比较采用Delong 检验。
P <0.05表示差异有统计学意义。 2 结果
2.1 桥本甲状腺炎性结节与甲状腺微小乳头状癌的最大径 114个桥本甲状腺炎性结节和76个甲状腺微小乳
头状癌最大径分别为(7.87±2.31)mm 、(8.35±2.12)
mm ,差异无统计学意义(t =1.450,P =0.149)。桥本甲状腺炎性结节和甲状腺微小乳头状癌在MRI 各序列图像信号特征相近(图1、2):T2WI 呈较高信号,T1WI 呈等信号,DWI 呈高信号。
正则化逻辑回归模型图1 女,32岁,甲状腺右叶外缘桥本甲状腺炎性结节。T2WI 示甲状腺右叶外缘结节状较高信号以及散在点状略高信号(A );T1WI 示右叶病灶呈略高信号(B );常规b 值DWI (b=800 s/mm 2)示右叶病灶呈高信号(C );高b 值DWI (b=2 000 s/mm 2)示右叶病灶呈高信号(D );增强T1WI 示右叶病灶呈轻度强化(E );箭示桥本甲状腺炎性结节
图2 女,41岁,甲状腺左叶边缘微小乳头状癌。T2WI 示病灶呈结节样不均匀较高信号(A );T1WI 示病灶呈等信号(B );常规b 值DWI (b =800 s/mm 2
)示病灶呈较高信号(C );高b 值DWI (b =2 000 s/mm 2)示病灶呈高信号(D );增强T1WI 示病灶呈轻度强化(E );箭示微小乳头状癌
2.2 影像组学特征预处理及特征选择 6 720个影像组学特征中无稀疏数据。由于已对缺失值进行特征平均值处理,因此无缺失值特征删除,亦无单个唯一值(重复值)特征删除。在第一步特征选择中,6 720个影像组学特征中分别发现高共线特征5 639个、零重要性特征5 957个、低重要性特征5 981个(相
互之间有重叠)。排除以上特征后,剩余239个特征。训练集共152个病灶,桥本甲状腺炎性结节和甲状腺微小乳头
状癌分别为91个和61个。测试集共38个病灶,桥本甲状腺炎性结节和甲状腺微小乳头状癌分别为23个和15个。在第二步特征选择中,带有L1正则化的LR 模型最佳逆正则化系数C 值为0.19(图3)。经SelectFromModel 最终选取30个影像组学特征,为ADC 原始图像形状特征和一阶统计量特征,其中形状特征14个、一阶统计量特征16个(图4)。
图3 LR 模型L1正则化路径图以及最佳逆正则化系数C 值的选取 图4 SelectFromModel 筛选出的30个影像组学特征
2.3 分类诊断模型超参数调优 除LR 模型在特征选择时已经确定最佳逆正则化系数C 值,其余模型超参
数调优如下:
LDA 模型求解最优化问题算法为使用奇异值分解,SVM 模型最佳逆正则化系数C 值为0.03、最佳核函数为线性、最佳核函数系数gamma 值为0.06,KNN 模型最佳取邻近点的个数为7个,GNB 模型最佳
类的先验概率为(0.8,0.2)和特征最大方差添加比例为1×10-7,CART 模型最佳树的最大深度为2、叶子节
点所需最少样本数为1、节点再划分所需最少样本数
为2、特征选取方法为gini 、特征划分点选择方法为best 。基于训练集数据,超参数调优前各模型分类诊断模型分类准确度由高到低依次为:GNB (0.876)、SVM
(0.849)、KNN (0.810)、LR (0.790)、LDA (0.789)、CART (0.724)。经超参数调优,基于训练集数据,各模型诊断准确度均有不同程度提高,提升幅度由高到低依次为:CART (0.151)、LR (0.098)、LDA (0.092)、KNN (0.052)、SVM (0.046)、GNB (0.032)。各
模型超参数调优前后分类准确度变化见表1。
表1 超参数调优对各分类诊断模型鉴别桥本甲状腺炎性结节和甲状腺微小乳头状癌的准确度 项目
SVM LR LDA KNN GNB CART 超参数调优前准确度(训练集) 0.849 0.790 0.789 0.810 0.876 0.724 超参数调优后准确度(训练集) 0.895 0.888 0.881 0.862 0.908 0.875 超参数调优后准确度提升(训练集) +0.046 +0.098 +0.092 +0.052 +0.032 +0.151 超参数调优后准确度(测试集) 0.895 0.895 0.894 0.868 0.816 0.737 超参数调优后敏感度(测试集) 0.87 0.87 0.87 0.80 0.80 0.47 超参数调优后特异度(测试集)
0.91
0.91
0.91
0.91
0.83
0.91
注:SVM :支持向量机;LR :逻辑回归;
LDA
:线性判别分析;KNN :K 邻近算法;GNB :高斯朴素贝叶斯;CART :分类回归树
2.4 超参数调优后分类诊断模型的测试集应用 基于测试集数据及入选特征,各分类诊断模型分类准确度由高到低依次为:SVM (0.895)、LR (0.895)、
LDA (0.894)、KNN (0.868)、GNB (0.816)、CART (0.737),准确度、敏感度及特异度见表1。各分类诊断模型AUC 由高到低依次为:SVM (AUC=0.97,
95% CI
0.903~1),LR (AUC=0.97,95% CI 0.897~1),LDA (AUC=0.95,95% CI 0.876~1),KNN (AUC=0.94,95% CI 0.853~1),GNB (AUC=0.86,95% CI 0.730~ 0.992),CART (AUC=0.77,95% CI 0.612~0.933)。各模型分类诊断模型ROC 曲线见图5。ROC 曲线两两比较,SVM 、LR 、LDA 、KNN 差异无统计学意义(P >0.05),GNB 与SVM 差异有统计学意义(Z =2.024,
P =0.043),CART 与SVM (Z =3.037,P =0.002)、LR (Z =2.889,P =0.004)、LDA (Z =2.747,P =0.006)、KNN (Z =2.557,P =0.011)之间差异均有统计学意义。
图5 各分类诊断模型鉴别桥本甲状腺炎性结节和甲状腺微小乳头状癌的ROC 曲线。LR :逻辑回归;KNN :K 邻近算法;SVM :支持向量机;LDA :线性判别分析;GNB :高斯朴素贝叶斯;CART :分类回归树
3 讨论
本研究基于甲状腺MRI 多序列图像影像组学机
器学习方法,对114个桥本甲状腺炎性结节与76个甲状腺微小乳头状癌进行鉴别诊断,共筛选出30个ADC 原始图像特征,其中形状特征14个、一阶统计量特征16个。构建LR 、LDA 、SVM 、KNN 、GNB
和CART 共6种单模型分类诊断模型并超参数调优。SVM (线性核)、LR 、LDA 等多种线性模型取得较好的分类效果,其中SVM 和LR 的AUC 达0.97,分类准确度接近90%。 3.1 分类诊断模型鉴别诊断桥本甲状腺炎性结节与甲状腺微小乳头状癌的价值 由于桥本甲状腺炎性结节与甲状腺微小乳头状癌在结节大小和超声图像特征上有一定相似性,有时超声不易区分两者[5]。以往对于良恶性难以诊断的甲状腺结节,往往借助超声引导下穿刺活检定性,然而权衡风险与受益,部分甲状腺诊疗指南不再推荐对1.0 cm 以下的甲状腺结节进行诊断性穿刺活检[9]。因此,进一步探索能够准确鉴
别诊断桥本甲状腺炎性结节与甲状腺微小乳头状癌
的影像学方法具有重要临床意义。基于影像组学的机器学习模型对部分常规影像学方法难以鉴别诊断的良、恶性病变或病变分级取得不错的分类效果[10-13]。本研究中对于鉴别桥本甲状腺炎性结节与甲状腺微小乳头状癌,在构建的6种机器学习分类诊断模型中,SVM (线性核)、LR 、LDA 这3种线性模型较另外3种
非线性模型KNN 、
GNB 、CART 表现更好,AUC>0.95,分类准确度接近90%,表明尽管两组病变大小、图像特征、DWI 信号强度等常规影像学表现有相似性,但在所筛选的影像组学特征上两者具有较好的区分度。3种线性模型中以SVM 分类性能最突出。根据SVM 模型特点,进一步表明在所筛选的特征下,两组病变的特征
值重叠较少、在分类边界线附近的样本区分度较好。当然,这也得益于本研究中科学严谨的特征选择方法,经过对影像组学特征进行两步筛选,数量较少
但又具有重要分类意义的30个特征得以保留。在6个分类诊断模型中,CART 对测试集数据的分类效果最差,可能与决策树容易发生过拟合有关[14]。因此,在基于影像组学和机器学习方法区分桥本甲状腺炎性
结节与甲状腺微小乳头状癌时,应该优先考虑使用
SVM 、LR 等线性分类诊断模型。
3.2 ADC 原始图像形状特征和一阶统计量特征的价值 本研究最终入选的影像组学特征为ADC 原始图
像形状特征和一阶统计量特征,表明与T1WI 、T2WI 、不同b 值DWI 及增强T1WI 等图像相比,
ADC 图像对于有效鉴别诊断桥本甲状腺炎性结节与甲状腺微小乳
头状癌更具潜在价值,与Wang 等[15]的研究结果有一定相似性。该研究基于甲状腺不同b 值DWI 和ADC 成像的信号测量发现,与不同b 值DWI 信号强度相比,ADC 值鉴别诊断甲状腺良性结节和乳头状癌时准确度更高,总体上乳头状癌的ADC 值明显低于良性结节。尽管ADC 值有助于区分甲状腺良、恶
性结节[16],但部分甲状腺良、恶性结节之间ADC 值也有重叠,特别是对于桥本甲状腺炎性结节与甲状腺微小乳头状癌的鉴别诊断,单纯依赖测量ADC 值可能鉴别效果较差[17]
。本研究显示,基于ADC 原始图像形状特征和一阶统计量特征的多个分类诊断模型鉴别桥本甲状腺炎性结节与甲状腺微小乳头状癌效能较好,表明影像组学在ADC 图像原有优势的基础上,利用ADC 图像潜在的、有价值的图像数据信息,进一步挖掘了ADC 图像的鉴别诊断价值。本研究经特征筛选,除ADC 原始图像的形
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论