⼀⽂掌握GO和pathway分析
原⽂链接:原⽂链接
在做转录组分析的时候,如何从众多差异基因中筛选出⽬标基因呢?
下⾯就以⼀篇⽂章为例,来看看⽤什么⽅法可以缩⼩差异基因范围,使⽬标基因挑选更有针对性。
⽂章案例
Identification of a novel biomarker, SEMA5A, for non-small celllung carcinoma in nonsmoking women
相关基因:SEMA5A
相关疾病:Carcinoma,Non-Small-Cell Lung;Lung Neoplasms
PMID: 20802022 影响因⼦3.622        GEO 相关样本:120
⽂章作者使⽤AffymetrixU133plus2.0芯⽚1检测了台湾地区⾮吸烟肺癌⼥性患者60对癌症和癌旁肺组织样本,利⽤配对T检验筛选了肿瘤组织中687个差异表达基因2,并且利⽤逆转录PCR和免疫组化进⾏了验证。如何将687个缩⼩范围呢?因此我们需要判断差异基因在肺癌细胞中主要富集在哪些功能类和代
谢通路。⽂章作者利⽤IPA(IngenuityPathway Analysis)软件对差异基因进⾏了功能分析,筛选出了16条显著性代谢通路3。在最显著改变的三条通路中,其中两条都和轴突导向信号通路(axonguidance)相关,作者很意外,于是就选定了轴突导向信号通路,并在其中挑选了差异表达倍数最⾼的SEMA5A基因作为后续的研究对象。作者最后利⽤kaplan-Meier⽣存分析证明了SEMA5A基因的低表达和⾮吸烟⼥性肺癌的低⽣存率有关联,其可能成为⾮⼩细胞肺癌预后的⼀个有效的⽣物标志物,也可能代表台湾地区病⼈的性别特异性。
归纳⼀下作者的整体思路,先差异基因,并通过功能分析进⼀步缩⼩差异基因的范围,再从中有针对性的挑选基因。
在差异基因的功能分析中,主要有GO功能分析和pathway分析,上⾯案例作者主要⽤了pathway分析。
名词解释
GO
GO是Geneontology的缩写,GO数据库分别从功能、参与的⽣物途径及细胞中的定位对基因产物进⾏了标准化描述,即对基因产物进⾏简单注释,通过GO富集分析可以粗略了解差异基因富集在哪些⽣物学功能、途径或者细胞定位。
Pathway
Pathway指代谢通路,对差异基因进⾏pathway分析,可以了解实验条件下显著改变的代谢通路,在机制研究中显得尤为重要。
GO分析好⽐是将基因分门别类放⼊⼀个个功能类的篮⼦,⽽pathway则是将基因⼀个个具体放到代谢⽹络中的指定位置。
⽂章分析结果
⼩编利⽤上述案例中的数据GSE19804在GCBI在线实验室⾸先进⾏差异分析(|foldchange|>2, P值<0.001Q值<0.05),得到了2202个差异基因。将差异基因分别进⾏GO(P值<0.01,FDR<0.01)和pathway分析(P值<0.05),富集得到351个GO term和110条pathway。结果如下图所⽰,表⼀和表⼆分别为部分GO富集结果和最显著的15条pathway分析结果。
结果怎么看呢??
结果怎么看呢
表头各个参数的解释如下,其中,重点看三个指标,enrichment score、p值和FDR。Pathway分析主
要看P值和FDR值,两者越⼩越好。GO分析还可看enrichmentscore,数值越⼤表⽰某个GOterm越容易受到实验因素的影响。
GO和pathway分析结果中都得到了⽂章中选定的axonguidance这个结果(红框)。
如何定位到基因呢??
如何定位到基因呢
将axonguidance中的差异表达基因全部挑选出来,列表如下。作者在⽂中挑选了显著性最⾼的SEMA5A作为后续的研究对象。在我们的分析中,当p值⼩于10^-6时默认为0,按照表达倍数排列SEMA5A也排在前列,和作者的结果较吻合。
Ps:因参数设置和⽂章中不同,结果仅供参考。
和pathway分析
GO和
教程:GO
教程:
⽬前有许多GO和pathway分析软件,GO分析软件有Avadis(商业软件)、BiNGO(开源java)、DAVID(基于web的⼯具)等,pathway分析有IPA 和MetaCore(商业软件)等。
但这些软件学习成本⾼,且许多都是商业软件。有没有⼀种分析⽅法⽆门槛,直接上⼿就可以搞定的呢?
GCBI平台,伸⼿党的福⾳,⽣信分析⽅法直接加载了模块,你需要做的只是创建⽅案,拖动模块,单击运⾏即可。⼩编⽤样本GSE19804演⽰⼀下,倒数10min,GO富集分析,pathway分析全搞定。
2、建⽴项⽬——⽅案,在⽅案界⾯,拖动模块,修改名字和参数,并⽤连接线将模块连接成⼀个⽅案,⼩编建⽴了如下差异分析和GO和pathway分析⽅案。
3、选择样本数据。
样本数据GSE19804直接来⾃于GCBI样本库,将样本发送到在线实验室。点击⽅案中样本模块,在样本分组管理中选择配对样本,选择好相应的对照组和实验组样。Lungnormal **N为对照组,Lungcancer **T为实验组。
4、设置各模块参数
差异分析 |fold change|>1.2 P值<0.05 , Q值<0.05
GO分析 分析类型⽣物功能分析p值<0.01 ,FDR<0.01
Pathway分析 p值<0.05
5、运⾏⽅案
是不是毫⽆压⼒?
附录:
⽂献技术及参数:
1、检测⼿段:GeneChip Human Genome U133 Plus 2.0 expression arrays (Affymetrix, Inc.)
2、差异筛选:配对t 检验 (P <10^-16)和Bonferroni 校正P值
go和java后端开发劣势3、pathway分析:IPA软件费希尔精确检验(fisher’s exact test) P<0.5
检测⼯具选择
可使⽤其他检测⼯具
GeneChip® Human Gene2.0 arrays
GeneChip® HumanTranscriptome Array 2.0(推荐)
拓展知识
差异分析基因结果解读
功能及信号通路分析及结果解读

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。