沙龙第⼋期:⽣信免编程genespring实操——万能芯⽚数据分析现场答疑
通知:freescience周末沙龙直播使⽤腾讯课堂,关注每⽇推送和通知报名参加。课程是meta与⽣信专题周轮替,并设有答疑环节,解决读者和友提出的问题。
⼩伙伴们,免编程差异的genespring软件好⽤吗?赵⽼师写了⼀整个系列,⽤还原⽂献的⽅式介绍了genespring的使⽤(发送⼤数据到后台,领说明书+查看整个系列)。发送沙龙到后台,复习前⼏期的沙龙内容。上周六,赵⽼师为⼤家在线讲解了免编程学⽣信-genespring差异分⼦案例实践--万能芯⽚数据分析,并现场解答友提出的相关提问(qq463367325)。
(*  ̄3)(ε ̄ *)感谢⼩编编组假期的⾟苦⼯作,⼤家可以领视频了!
发送 GSNX 到后台,马上得全套现场课程+答疑视频,开始⼩⽩的历练之路吧~
最近提过问题但错过现场答疑的同志,仔细看推送中有没有⾃⼰的提问,领到录像好好学习……
要是有追问,可以组织语⾔在⾥求助(提问前请仔细阅读这篇求助得回应秘诀),如果没有解答,周六统⼀直播回答。点这⾥查看什么是优质的提问~
发送到有道云笔记的优质提问将获得专场解答,将问题写在有道云笔记⾥,进qq463367325,把有道云笔记链接私信发给⼩觅0号(点这⾥看欧阳同学整理的有道云使⽤⼼得)。
问答版与现场答疑内容仅供参考,并⾮标准答案,欢迎⼤家深⼊思考,提出不同的见解。
赵⽼师的⽣信沙龙问答版
问:genespring在哪提供配对信息???
赵忻艺部分⽂字回答:见之后操作课程演⽰
问:
1.可以直接⽤GSE的soft⽂件进⾏临床相关性分析吗?
赵忻艺部分⽂字回答:soft和临床相关性⽆关系
2.散点图可以放在⽂章中吗?
赵忻艺部分⽂字回答:问题表达不清⽆法回答
3.进⾏临床相关性分析时,数据需要进⾏Z-score处理吗?
赵忻艺部分⽂字回答:Z-score与临床相关性⽆关系
4.GEO的数据有包含⽣存资料的吗?
赵忻艺部分⽂字回答:⼤部分不包含,部分包含
问:想问⼀下,如何预测两个基因之间的关系?
赵忻艺部分⽂字回答:ppi和⽪尔森相关系数
问:毕业论⽂中的第⼀部分和第⼆部分某些⽅法学完全⼀样,能不能再复制⼀遍凑字数?
赵忻艺部分⽂字回答:⽆法回答。也不是⽣信问题。
问:请问如果在TANRIC⽤位置搜索到的lncRNA如何能在TCGA到对应的原始数据(因为⽤ENSG号和基因名字搜不到)
赵忻艺部分⽂字回答:可以⽤ENSG号到,操作见录像
问:您好,⽼师我想请教⼀下,GEO2R⾥,TOP250差异基因分析中F值是什么意思呢?我要怎么才能转换得到LogFc呢?
赵忻艺部分⽂字回答:F值代表⽅差,分析可能未定义分组,导致结果出现了F值⽽⽆fold change值
问(留⾔板):LncRNA研究之lncRNA芯⽚分析
你好,请教如何把mRNA和lncRNA数据分开?
赵忻艺部分⽂字回答:见之后操作课程演⽰
问(留⾔板):LncRNA研究之lncRNA芯⽚分析
有⽊有完成上⾯的R语⾔代码哦
答:⼿头⽊有现成的,⾕歌⼀下或者在github⾥搜搜
赵忻艺部分⽂字回答:见之后操作课程演⽰
问:请教,论⽂还没有发表的GEO芯⽚数据是不是不能⽤GENESPRING来分析?因为好多统计⽅法选择之类的不知道作者⽤的是什么
答:可以根据⾃⼰的需要重新分析啊
赵忻艺部分⽂字回答:见之后操作课程演⽰
问:GEO数据⽤genespring分析后有许多同⼀个基因对应了不同的检测值怎么处理
赵忻艺部分⽂字回答:第四期沙龙回答过同样问题(点链接直达)
mp.weixin.qq/s/CwMvQPYvDCASqxFGQHkLDg
问:
1. WGCNA分析时电脑最低配置;
赵忻艺部分⽂字回答:主要看数据量
2. GEO数据分析时使⽤⼈家标准化过的数据跟⽤原始数据做分析时的差异,有什么需要特别注意的,主成分分析,聚类分析也⽤同样⽅法做吗?为啥我看到的⽂章很多没有做主成分分析呢。归⼀化处理呢?那些分析(赵忻艺录像中已回答)
3. IPA富集pathway的时候,那个Z-score是⼲嘛⽤的?
(赵忻艺录像中已回答)
4.GEO数据库在线分析,做差异基因分析时是⽤什么⽅法做质量控制和均⼀化处理的?
(赵忻艺录像中已回答)
5.Affymetrix Human Genome U133 Plus 2.0 Array芯⽚,我们在筛选时是看adj P-value?还是P-value?(如下图),adj P-value是什么意思?
(赵忻艺录像中已回答)
6.⼀个基因对应多个探针名字导致的,这种情况应该怎么处理呢,是去除这⼀类基因吗,还是其他⽅式,去除的话怎么去除
(赵忻艺录像中已回答)
7.在做PPI⽹络图时,我发现好多⾼级的⽹络图感觉⽤cytoscape做不出来,⼈家是怎么做出来的呢,除了cycoscape还有更⾼级得吗
赵忻艺部分⽂字回答:可以做出(应该是还未完全掌握cytoscape作图),或做完图后ppt修改、PS修改
8.如果筛选出来的差异基因的基因名有重复的,那么做热图的时候是不是取平均值呢?
赵忻艺部分⽂字回答:只取⼀个
9.  在TCGA下载了甲基化的数据,合并之后⽤excel打开第⼀列是甲基化的位点cg加⼀串数字,但是没有注明基因名称,请问怎么根据甲基化位点确定是哪个基因?
赵忻艺部分⽂字回答:下载注释⽂件
10. 得到差异基因中出现:CKAP2 /// IGLC1 /// IGLJ2 /// IGLJ2 /// IGLJ3 /// IGLJ3/// IGLJ3 /// IGLV1-44 /// IGLV2-14 /// IGLV@,'///'代表什么意思?这组值还能⽤吗?取哪个名称⽤
(赵忻艺录像中已回答)
(赵忻艺录像中已回答)
[现场追问:a.有芯⽚可以检测isoform表达吗?
赵忻艺部分⽂字回答:可以
b.为什么这⼏个名字⼀样?
赵忻艺部分⽂字回答:别名或重叠基因]
11.假如⼀个数据集⾥只有病例组的CEL⽂件,我可以⽤另外⼀个数据集的健康对照作为对照组吗?这两个数据集是⼀个平台的,⽽且研究的⽅向差不多
赵忻艺部分⽂字回答:不可以,设计要⼀致
12.下载了注释⽂件以后,要怎么进⾏修改注释⽂件,才能在R中运⾏?
赵忻艺部分⽂字回答:⽆法回答
13.怎么知道调⽤的包是来⾃于R⾃带的还是bioconductor的呢
赵忻艺部分⽂字回答:百度
14.安装某个包的时候有没有故意放在当下的运⾏路径中呢,还是每次打开不同的⼯作路径都要重新装⼀次
赵忻艺部分⽂字回答:不需要
15.LncRNA,miRNA,mRNA芯⽚数据有什么不同,处理起来有什么不同
赵忻艺部分⽂字回答:属于哪个公司产品
16.在GEO中下载的原始⽂件是txt⽂件,⽽不是CEL⽂件,要怎么处理才可以在R中筛选差异基因.
赵忻艺部分⽂字回答:不同的R包
17.在GEO数据库中到的数据集,在提交者没有明确注释的情况下,如何进⾏样本的分组。
(赵忻艺录像中已回答)
18.做热图⼀般是把所有差异表达基因都做吗,还是取前50,前100?
赵忻艺部分⽂字回答:根据需求
19.得到的差异基因做通路富集分析,能注释出来相关通路,⾥⾯count有上下调的基因,为什么把上下调差异表达基因分开做通路富集分析,上调基因就注释不到通路呢?
赵忻艺部分⽂字回答:为什么都要有阳性结果呢
20.做通路富集分析时,⽤上调的基因(300多个),可以出⼀些通路。⽤下调的基因(300多个)也可以富集⼀些通路,把上下调的基因加起来(700多个)却富集不出任何通路,这是为什么呢?赵忻艺部分⽂字回答:富集和基因数⽆关
21.如果⽤多个芯⽚、多平台的数据选择各⾃平台注释⽂件得到差异基因交集后,可以绘制热图吗?这种取交集的结果可信吗?批间差等影响因素⼤吗?
赵忻艺部分⽂字回答:组合,异质性分析
22.请问经常运⾏r的时候会出现“因为‘lib’没有被指定”是什么意思要怎么解决
赵忻艺部分⽂字回答:没有遇到过
23.主成分分析到底是什么⽤意,如果我研究的是癌和癌旁,还需要主成分分析吗?主成分分析主要⽤在哪些情况下?
赵忻艺部分⽂字回答:见之后操作课程演⽰
24.R语⾔分析,如果不是affy芯⽚,是illumina或者Aginent芯⽚,能⽤RMA做质量控制吗?
赵忻艺部分⽂字回答:PCA
(学习陈同⽼师的⼀⽂看懂PCA主成分分析)
25.⽣存分析中根据基因表达量分为⾼低组,这个界限是不是根据该基因的算术平均值界定的?
赵忻艺部分⽂字回答:以前回答过同样问题。
数据标准化,cytoscape和⽣存分析界限值——学术问答版14(点⽂字电梯直达)
26.每次重新开r软件,都要重新安装⼀次包才能library是怎么回事?
赵忻艺部分⽂字回答:不会,可能是电脑⾥安装了多个R的版本。
27.WGCNA三个做分析的数据⽂件怎么获得和整理,哪⾥可以下载呢?
赵忻艺部分⽂字回答:以后会详细介绍
28.我看不少芯⽚的再分析的⽂献中都有“质控”这些步骤。请问可以介绍⼀下怎么做吗?
赵忻艺部分⽂字回答:见之后操作课程演⽰
29.400多个基因居然在david⾥富集不出Homo sapiens的通路,只有Bos taurus的通路,这样正常吗,Bos taurus的通路能⽤吗
赵忻艺部分⽂字回答:根据样本背景,如果研究⼈类的,Bos taurus当然不能⽤
30.我筛选出⼏个基因(数量少),做了GO,PATHWAY,PPI,感觉⼯作量不够⼤,还有哪些⽣信⽅法可以进⼀步深⼊做下去呢,不想做实验,但是GO,PATHWAY,PPI感觉⼯作量⼜不⼤,发不了好⽂章。
赵忻艺部分⽂字回答:分析更多数据,或者调整切⼊点
问:
1.请问在做乳腺癌TCGA数据库中的ceRNA时,寻⽬的lncRNA可能结合的miRNA,搜索感兴趣的lncRNA可能结合的miRNA。我们知道的有两个⽹站,预测使⽤到的是DIANA数据库下的在线⽹站,链接如下:carolina./diana_tools/web/index.php?r=lncbasev2%2Findex-predicted
和基于这个原理介绍的⽹站是starbase2.0,链接如下:
starbase.sysu.edu/mirLncRNA.php
请问:这两个⽹站都需要⽤到,还是只⽤⼀个⽹站预测就可以?
赵忻艺部分⽂字回答:根据具体情况
赵忻艺部分⽂字回答:根据具体情况
2.如何到上述两个⽹站的lncRNA-miRNA的数据库⽂件或者接⼝?
赵忻艺部分⽂字回答:有导出⽂件
3.如何设计lncRNA- miRNA-mRNA这种ceRNA的实验,有没有参考的教程或者⽂章?
赵忻艺部分⽂字回答:mp.weixin.qq/s/VdDNMhX-dhjjULPTusnPwA
4.做完lncRNA- miRNA-mRNA这种ceRNA的⽹络图后,是否需要做WGCNA,做miRNA的还是Mrna的WGCNA?
赵忻艺部分⽂字回答:不⽤
5 如何探究lncRNA与转录因⼦TF的结合位点?
赵忻艺部分⽂字回答:Chip-seq 注释到lncRNA启动⼦区
问:
1.癌和癌旁差异基因⽐较是否⼀定需要⽤配对设计T检验?
赵忻艺部分⽂字回答:不⼀定
2.如何使⽤genespring配对⽐较,genespring还有哪些好⽤的功能?
赵忻艺部分⽂字回答:差异基因
3.GEO数据库⾥⾯的expression of miccroarry,RNA-Seq等不同芯⽚类型是不是得分开⽐较?筛选差异基因常⽤什么芯⽚。赵忻艺部分⽂字回答:单独分析
4.简要介绍⼀下这⼏种芯⽚⽤于什么筛选
Expressionprofiling by MPSS
MPSS表达谱
·Expressionprofiling by SAGE
SAGE表达谱
·Expressionprofiling by SNP array
单核苷酸多态性序列
·Expressionprofiling by array
阵列表达谱
·Expressionprofiling by genome tiling array
基因组平铺阵列表达谱
·Expression profilingby high throughput sequencing
通过⾼通量测序表达谱
·Genomebinding/occupancy profiling by SNP array
基因组结合/占⽤分析的SNP阵列
·Genomebinding/occupancy profiling by array
基于阵列的基因组结合/占⽤分析
·Genomebinding/occupancy profiling by genome tiling array
基因组平铺阵列的基因组结合/占⽤分析
·Genomebinding/occupancy profiling by high throughput sequencing
⾼通量测序的基因组结合/占⽤分析
·
Genomevariation profiling by SNP array
SNP阵列的基因组变异分析spring教学视频
·Genomevariation profiling by array
基于阵列的基因组变异分析
·Genomevariation profiling by genome tiling array
基因组变异分析基因组平铺阵列
·Genomevariation profiling by high throughput sequencing
⾼通量测序的基因组变异分析
·Methylationprofiling by SNP array
SNP阵列甲基化分析
·Methylationprofiling by array 阵列的甲基化分析
·
Methylationprofiling by genome tiling array
基因组平铺阵列的甲基化分析
·Methylationprofiling by high throughput sequencing
甲基化谱的⾼通量测序
·Non-coding RNAprofiling by array
阵列⾮编码rna分析
·Non-coding RNAprofiling by genome tiling array
⾮编码RNA分析基因组平铺阵列

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。