Heterogeneity analysis of pancreatic cancer and identification of molecular subtypes of tumor cells based on CEACAM5,LGALS1and CENPF gene expression
SUN Jingjie 1,LU Peng 2,GUAN Shasha 1,LIU Songsong 21
Department of Oncology,2Departmentment of Hepatobiliary Surgery,Hainan Hospital of Chinese PLA General Hospital,Sanya 572013,China
摘要:目的探讨胰腺癌的异质性和肿瘤细胞分子亚型鉴定新方法,鉴定胰腺癌发展过程中的特征基因。方法分析
GSE155698数据集中16例胰腺癌组织单细胞测序数据,初步聚类后,根据各细胞EPCAM 基因的表达情况分离胰腺癌细胞,再聚类、分后鉴定特征基因,进行通路GO 和KEGG 通路富集分析,并进行拟时序分析。提取癌症基因组图谱179例胰腺癌患者和正常胰腺组织基因表达库中171例正常人基因表
达数据、临床信息及预后情况,结合人类蛋白表达图谱蛋白表达情况对各亚型关键基因进行验证。最后通过细胞功能实验验证CEACAM5、LGALS1、CENPF 对胰腺癌细胞的增殖、侵袭与迁移等功能的影响。结果对16例胰腺癌样本48570个细胞进行分析后发现,细胞总共被聚类为22,其中包含5胰腺癌细胞。这些胰腺癌细胞被分为3:亚型1、亚型2和亚型3,分别具有完全不同的基因表达模式和功能。亚型1胰腺癌细胞的特征基因主要富集于蛋白代谢过程的负调节、铁死亡和抗原提呈相关通路;亚型2胰腺癌细胞的特征基因主要于肽合成过程、翻译和核糖体相关通路;亚型3胰腺癌细胞的特征基因主要富集于ATP 代谢过程、糖酵解/葡萄糖生成和细胞周期相关通路。亚型2和亚型3可能是由亚型1发展而来,亚型3可能是胰腺癌细胞发育的最终状态。各亚型的关键特征基因CEACAM5、LGALS1、CENPF 的表达情况也在发育轨迹中展现了不同状态。基因和蛋白表达层面均显示各亚型的关键特征基因CEACAM5、LGALS1、CENPF 在胰腺癌中高表达,且与患者的不良预后相关,当下调CEACAM5、LGALS1、CENPF 的表达后,胰腺癌细胞的增殖(P <0.05)、迁移(P <0.05)和侵袭(P <0.05)能力均被抑制。结论胰腺癌细胞有较强的异质性,基于CEACAM5、LGALS1、CENPF 基因表达可鉴定肿瘤细胞发展过程中的不同分子亚型,且影响胰腺癌细胞的增殖、侵袭和转移。关键词:胰腺癌;分子亚型;异质性;单细胞测序
J South Med Univ,2023,43(9):1567-1576doi 10.12122/j.issn.1673-4254.2023.09.14
·
·1567
胰腺癌是最致命的恶性肿瘤之一,自20世纪60年
代以来,胰腺癌的存活率基本尚未提升[1,2]
。由于胰腺癌
通常在晚期才得以诊断,且大多数方案效果欠佳,
导致患者总体预后不良[3,4]。多种因素与患者的不良预
后相关,如性别、年龄、肿瘤分期、营养状况、基础疾病等[5]。然而,各胰腺癌患者恶性程度不一的原因还未完全阐明。
胰腺癌在发展过程中涉及了大量细胞丰度改变和基因表达的变化,这造成了肿瘤的高度异质性[6,7]。同时,胰腺癌相较于其他肿瘤更高的异质性也是造成该病
难以规范化诊疗的重要原因[8,9]。在胰腺癌进展中部分
基因可能对肿瘤的增殖、侵袭及迁移功能有重要促进或抑制作用,提示是该病的潜在靶点。寻
并鉴定胰腺癌细胞的特殊分子亚型,对肿瘤发展过程中关键分子的寻有明显帮助,也对疾病的个性化和疗效的提高有较大意义。
因此,本文利用了数据库已有的单细胞测序数据,分析了胰腺癌细胞异质性情况和各类特征基因,鉴定了胰腺癌细胞在发展过程中的不同亚型和不同的潜在功能,并结合临床样本基因与蛋白表达情况及患者预后信息,探讨肿瘤细胞分子亚型鉴定新方法,并寻胰腺癌发展过程中的特征基因,最后对所鉴定的不同亚型胰腺癌的特征基因进行增殖、侵袭和迁移等功能实验验证,为胰腺癌潜在靶点的寻提供了新的依据。1资料和方法1.1研究对象
本研究从GEO 数据库(bi.v/geo/)提取了GSE155698数据集中16个胰腺癌原癌组织单细胞测序样本,共分析了48570个细胞的28411个基因的表达情况。同时,本研究纳入了癌症基因组图谱179例胰腺癌患者和正常胰腺组织基因表达库中171例正常人,分别提取各研究对象的基因表达数据、临床信息及预后情况。
1.2单细胞数据初步聚类和提取肿瘤细胞
将下载的单细胞测序样本进行预处理,重命名、合并样本。读入R (版本号4.0.4)软件,载入Seurat 包,创建对象,去除检测到基因数目超过2500或低于200的细胞,去除单个细胞中线粒体基因数目占比超过>5%的细胞。标准化数据,鉴定高变基因,并进行PCA 分析。由于UMAP 在分过程中考虑了
每一细胞相似基因表达的特征,也保留了了数据的全局结构,因此选用UMAP 聚类,并初步分析细胞聚类情况和各类特征基因。根据细胞表面标志物EPCAM 、PTPRC 、PECAM1等基因的表达情况,去除免疫细胞、基质细胞等,提取肿瘤细胞进行后续分析。
1.3分子亚型分析和特征基因鉴定
对所提取的到的肿瘤细胞进行分子亚型分析,对细胞基因表达矩阵标准化后,鉴定高变基因,利用UMAP 对肿瘤细胞的基因表达谱进行二次降维、细胞类型注释。利用FindAllMarkers 函数根据差异倍数和P 值计算每个亚型肿瘤细胞的特征基因,min.pct 参数设置为0.25,logfc.threshold 参数设置为0.5,最终得到各亚型的特征基因。
1.4通路富集分析
使用WEB-based GEne SeT AnaLysis Toolkit ( )进行GO 和KEGG 通路富集分析。分别输入各亚型特征基因,分别与GO 和KEGG 数据库中通路进行比对和富集,计算富集分数和FDR 值,按照富集分数由高到低排序,并利用条形图可视化。1.5发育轨迹分析
利用拟时序分析方法寻各亚型细胞发育轨迹。使用monocle3包进行拟时序分析,按照前述步骤对胰腺癌细胞基因表达矩阵进行降维、聚类和分,运行monocle 进行拟时序分析,推断发育轨迹,检测关键特征基因在各分子亚型的细胞中的表达变化趋势。1.6基因表达分析与检测
胰腺癌组织和正常胰腺组织的基因表达检测采用GEPIA2(gepia2.cancer-pku/#index ),生存分析使用Kaplan-Meier Plotter (kmplot/analysis/)分析工具,胰腺癌组织中蛋白表达检测参照人类蛋白表达图谱(The Human Protein Atlas project , )。1.7qRT-PCR 实验
引物通过NCBI 在线设计,并经BLAST 验证产物特异性。引物长度范围在16~24个碱基对,T m 值约60℃,选择GC 含量在40%~60%,由重庆擎科生物公司合成。使用PrimeScript RT 试剂盒子和SYBR Premix Ex Taq ™试剂盒(Takara ,日本)进行反转录及荧光定量反应。采用2-ΔΔCt 法计算mRNA 相对表达量,并归一化至GAPDH 表达量。CEACAM5前后引物分别为GGACTTTCCAGCAATCCACC 、GGGCTTGGCACG TATAGGAT ;LGALS1前后引物分别为GACGC TAAGAGCTTCGTGCT ,CGTTGAAGCGAGGGTTG AAG ;CENPF 前后引物分别为TCTCCGAGAGGTCG TTTTCC ,AGCTGAAACTGCCTTTGCTG 。1.8载体构建与细胞转染
构建目标基因的siRNA 片段,其中基因CEACAM5靶序列5-GCCGCAAUAAUUCCAUAGU-3;基因CENPF 靶序列5-GTTTCAGCTTGACAGTC TCG-3;基因LGALS1靶序列5-ACCUGUGCCUACACUUC AA-3(吉玛基因)。取生长状态良好的细胞行siRNA 转染操作。细胞接种密度使其第2天汇合度50%~70%为
J South Med Univ,2023,43(9):1567-1576www.j-smu
·
·1568
宜,接种后继续培养。第2天进行转染操作:向无酶无菌的1.5mL Eppendorf管加入125μL Opti-MEM培养基和5μL Lipofectamine3000(Invitrogen),充分混匀(A),静置5min。向无酶无菌的1.5mL Eppendorf管中分别加入125μL Opti-MEM培养基和5μL siRNA或阴性对照,混匀(B),静置5min。将上述AB溶液混合,静置10~20min。将转染混合液均匀加入6孔板中,放入培养箱培养。转染过后的细胞用来做qPCR检测以及行细胞功能实验。
1.9细胞增殖实验
细胞转染24h可行细胞活力CCK8(索莱宝)和EdU(锐博)的检测。对于CCK8实验,每孔加入10μL CCK8试剂,孵育2.5h。用酶标仪测量细胞的吸光度A450nm并记录。连续测量4d细胞活性。对于EdU实验,按照EdU标记、细胞固定、Apollo染、细胞核DNA染、荧光检测步骤以此完成实验操作。
1.10细胞迁移和侵袭实验
细胞转染48h后,行细胞transwell迁移和侵袭实验。对于迁移实验,细胞接种个数调整至5×104/孔;对于侵袭实验,细胞接种个数调整至8×104/孔,接种前小室中预先加入培养基稀释后的Matrigel30μL
(Corning),放入细胞培养箱中孵育1~2h。16~24h后取出孔板中的小室(MERCK),用细胞固定液(碧云天)固定15min后,放入1%的结晶紫(索莱宝)染料中,染,约5~10min。染完成后立即放入PBS中清洗干净,干燥后于显微镜观察拍照。
1.11统计学分析
使用SPSS20.0进行统计学分析,组织基因表达差异分析比较采用Wilcoxon非参数秩和检验,细胞功能实验中两组间差异比较采用t检验,生存分析使用Kaplan-Meier法,P<0.05时认为差异具有统计学意义。单细胞数据分析采用Seurat包,归一化采用harmony 包,细胞发育轨迹分析采用monocle3包。
2结果
log ln lg的互换公式
2.1胰腺癌原癌组织细胞初步聚类情况
利用UMAP对16个胰腺癌原癌组织单细胞样本的48570个细胞进行分析后发现,细胞总共被聚类为22(图1A)。部分类间所处空间位置紧密,如0和2细胞,提示这些类的细胞可能有相同或相近的基因表达模式;部分类间所处空间位置相隔较远,提示这些类的细胞基因表达模式可能有明显差异,具有不同的生物学功能,如14和16。对各类特征基因进行鉴定(图1B),发现各类细胞的基因表达模式有明显差异,如:0主要高表达S100A8、S100A9和S100A12;1细胞高表达IL7R、GIMAP7和LTB;3
细胞高表达SPP1、RNASE1和CSTB。
2.2鉴定和分析胰腺癌原癌组织中的肿瘤细胞
根据细胞表面标志物EPCAM、PTPRC、PECAM1等基因的表达情况,利用人工标注的方法鉴定免疫细胞、基质细胞和肿瘤细胞等。去除免疫细胞、基质细胞,提取肿瘤细胞。鉴定发现4、9、11、12和20细胞高表达EPCAM(图2A),共2010个细胞,提示这些细胞为肿瘤细胞,因此将其进行后续分析。这些类的细胞高表达KRT19、PMEPA1、ITGB4、S100A16和KRT7等基因(图1B)。将提取的肿瘤细胞使用UMAP再聚类,共将其分为3类:亚型1、亚型2和亚型3(图2B),各亚型间整体基因表达模式有明显差异。
2.3不同亚型胰腺癌细胞的分子特征分析
分别分析亚型1、亚型2和亚型3胰腺癌细胞的基因表达情况(图3A),发现亚型1主要高表达CEACAM5、CD55、CEACAM6、S100P、CLDN18、LMO7、TFF1、SPINK1等基因;亚型2主要高表达RPL32、RPS18、RPL13、RPS4Y1、LGALS1、RPS3A、PMEPA1、NNMT、KRT19等基因;亚型3主要高表达MKI67、CENPF、ASPM、CDKN3、TOP2A、UBE2C、CDK1、BIRC5、PTTG1等基因。3种亚型的胰腺癌细胞有完全不同的基因表达模式,提示各类细胞的发展可能有明显不同。通过进一步分析发现CEACAM5、LGALS1、CENPF分别在亚型1、亚型2和亚型3胰腺癌细胞中高表达(图
3B~D)。
2.4各亚型胰腺癌细胞特征基因功能分析
亚型1胰腺癌细胞的特征基因主要富集于蛋白代谢过程的负调节、铁死亡和抗原提呈相关通路(图4A、B);亚型2胰腺癌细胞的特征基因主要于肽合成过程、翻译和核糖体相关通路(图4C、D);亚型3胰腺癌细胞的特征基因主要富集于ATP代谢过程、糖酵解/葡萄糖生成和细胞周期相关通路(图4E、F)。
2.5不同亚型胰腺癌细胞的发育轨迹分析
图5A、B显示亚型2和亚型3胰腺癌细胞可能是由亚型1发展而来,且亚型3可能是胰腺癌细胞发育的最终状态。其中,各亚型的关键特征基因CEACAM5、LGALS1、CENPF的表达情况也在发育轨迹中展现了不同状态,提示这些基因在胰腺癌发展过程中可能起关键作用(图5C)。
2.6各亚型肿瘤的基因表达和临床相关性分析
Kaplan-Meier Plotter工具使用自由度高、能自动选择最优的分组策略,根据基因表达量对患者进行最优分组,得以寻到各基因的最佳临界值。高表达CEACAM5(P=0.049)、LGALS1(P=0.009)、CENPF (P<0.001)的胰腺癌患者有明显较差的预后(图6A~C)。同时,CEACAM5、LGALS1、C
ENPF基因在胰腺癌组
www.j-smu J South Med Univ,2023,43(9):1567-1576·
·1569
图1胰腺癌原癌组织细胞初步聚类情况
Fig.1Initial clustering of pancreatic cancer primary tumor cells.A :UMAP clustering of single cells from pancreatic cancer primary tumor tissue.B :Identification of differentially expressed genes among different clusters.
A
-10
-5
0510
UMAP_1
1510
50-5-10
U M A P _2
B
J South Med Univ,2023,43(9):1567-1576www.j-smu
·
·1570
织中的表达量均高于正常胰腺组织(P <0.05,图6D~F )。2.7胰腺癌组织中各亚型关键分子蛋白表达分析
利用蛋白表达数据库(The Human Protein Atlas )胰腺癌组织中对各亚型关键特征分子蛋白表达情况进行
了检测,发现与基因表达情况一致,各胰腺癌组织中亚型的关键特征基因CEACAM5、LGALS1、CENPF 均高表达(图7)。
图2鉴定和分析胰腺癌原癌组织中的肿瘤细胞
Fig.2Identification and analysis of tumor cells in pancreatic cancer primary tumor tissue.A :Expressio
n of the tumor marker EPCAM in different cell clusters.B :UMAP clustering of extracted tumor cells.
E x p r e s s i o n l e v e l
4
3
2
1
0EPCAM
02
46
8101214161820
Identity
Subtype 1Subtype 2Subtype 3
5
-5
U M A P _2
-5
510
15
UMAP_1
A
B
图3不同亚型胰腺癌细胞之间的分子特征分析
Fig.3Molecular feature analysis of different subtypes of pancreatic cancer cells.A :Heatmap of gene expression in different subtypes of pancreatic cancer cells;B :Gene mapping diagram;C :Scatter plot of gene expression;D :Peaks and valleys plot of gene
expression.
A B
C
D
www.j-smu J South Med Univ,2023,43(9):1567-1576
D ·
·1571

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。