研究方法及试验手段:
转录组
1. 试验材料及RNA提取
采用标准提取方法(Trizol法/CTAB 法/多糖多酚提取试剂盒等)提取样本中的总RNA,用于转录组测序。并通过琼脂糖凝胶电泳、NanoPhotometer spectrophotometer、Agilent 2100 bioanalyzer对RNA样品进行严格质控,检测RNA样品的纯度、
浓度、完整性及是否存在污染等,以保证使用合格的样品进行转录
组测序。
2. 转录组测序及数据组装(RNA-Seq 测序技术)
实验流程按照Illumina公司提供的步骤执行,包括制备文库和测序实验。样品提取总RNA经质检合格后,使用连接有Oligo(dT)的磁珠富集真核生物mRNA。随后在NEB Fragmentation Buffer
中用二价阳离子将得到的mRNA随机打断。以片段化的mRNA为模版,随机寡核苷酸为引物,在M-MuLV
逆转录酶体系中合成cDNA第一条链,随后用RNaseH降解RNA链,并在DNA polymerase I 体系下,以dNTPs为原料合成cDNA第二条链。纯化后的双链cDNA经过末端修复、加A尾并连接测序接头,用AMPure XP beads筛选250-300bp左右的cDNA,进行PCR扩
增并再次使用AMPure XP beads纯化PCR产物,最终获得文库。文库构建完成后,先使用Qubit2.0 Fluorometer进行初步定量,
稀释文库至1.5ng/ul,随后使用Agilent 2100 bioanalyzer对文库的insert size进行检测,insert size符合预期后,qRT-PCR对文
库有效浓度进行准确定量(文库有效浓度高于2nM),以保证文库质量。文库质检合格后用Illumina Novaseq 平台测序,测序策略
为PE150bp。
3.基因表达分析
为了保证数据分析的质量及可靠性,需要对测序获得的原始数
据进行过滤,去除带接头(adapter)的、含N的、低质量的reads,获得后续分析使用的clean reads。通过HISAT2比对软件将质控后的clean reads比对到参考基因组上。比对完成后,根据基因在参
考基因组上的位置信息统计每个基因从起始到终止范围内覆盖的reads数目。采用subread软件中的featureCounts工具对基因进行表达水平的定量。由于测序深度和基因长度的影响,采用FPKM 值表示RNA-seq的基因表达值。
4. 差异基因筛选
基因表达定量完成后,对其表达数据进行统计学分析,筛选样
本在不同状态下表达水平显著差异的基因。首先对原始的
readcount进行标准化(normalization),对各样本的测序深度进行校正,然后统计学模型进行假设检验概率(pvalue)的计算,最后进行多重假设检验校正,得到FDR值(错误发现率)。由于本研究设有生物学重复,所以通过DESeq2(Anders et al, 2014)软件进行基因表达差异显著性分析,标准化方法为DESeq ,P-value计算模型为负二项分布, FDR计算方法为BH。差异基因筛选标准一般为|log2(FoldChange)| > 0 & padj < 0.05。
5. 基因表达聚类分析
采用主流的层次聚类对不同处理时间点的两组样本之间的差异基因集进行聚类分析,对表达数据的行进行均一化处理,将表达模式相近的基因聚在一起,这些基因可能具有共同的功能或参与到共同的代谢途
径及信号通路中。
6. GO和KEGG富集分析
采用clusterProfiler软件对每个差异比较组合的所有差异基因集、上调差异基因集、下调差异基因集进行GO功能富集分析、KEGG通路富集分析等,可以到不同条件下的差异基因与哪些生物学功能或通路显著性相关。
GO(Gene Ontology)是描述基因功能的综合性数据库,可分为生物过程(biological process)和细胞组成(cellular
component)分子功能(Molecular Function)三个部分。GO功能富集通常以padj小于0.05作为为显著性富集的阈值。
KEGG(Kyoto Encyclopedia of Genes and Genomes)是整合
了基因组、化学和系统功能信息的综合性数据库。KEGG通路富集
通常以padj小于0.05作为显著性富集的阈值。
7. qRT-PCR验证
对两个不同处理时间的样本进行总RNA的提取或者直接使用
转录组测序中提取的RNA,进行RNA逆转录合成cDNA。挑选几
个表达量高的mRNA且差异变化明显的mRNA,设计合适的引物
进行PCR扩增,利用Mastercycler® ep实时荧光定量PCR仪对
样品进行表达特性分析。
广泛靶向代谢组
1.代谢物提取和检测
用70% 的甲醇提取各样本中的代谢物用于UPLC-MS/MS分析。基于自建数据库MWDB(metware database),根据Q1、Q3、RT、DE、CE、二级谱等信息进行物质定性,利用三重四级杆质谱
的多反应监测模式(multiple reaction monitoring,MRM)对物
质进行定量。项目设置3个以上质控样本(QC)用于质控分析,以保证检测结果的准确性。
2.差异代谢物筛选
结合单变量统计分析和多元统计分析的方法进行差异代谢物的
筛选。多元统计分析方法包括主成分分析、偏最小二乘法判别分析等,基于OPLS-DA结果,从获得的多变量分析OPLS-DA 模型的
reaction研究变量重要性投影(variable importance in projection,VIP),可以初步筛选出不同品种或组织间差异的代谢物。单变量统计分析方法包
括参数检验和非参数检验,可以结合单变量分析的p-value或者差
异倍数值(fold change)来进一步筛选出差异代谢物。通常以
fold change≥2或fold change≤0.5且VIP≥1作为筛选标准。
3.KEGG注释和富集
差异代谢在生物体内相互作用,形成不同的通路,利用KEGG
数据库(Kanehisa et al. 2000)对差异代谢物进行注释并展示可以更直观的展示代谢物之间的关系。对差异显著代谢物KEGG的注释结果按照KEGG中通路类型进行分类或者通过超几何分布进行KEGG
通路富集分析,可以选择显著富集的分类或通路进行后续数据挖掘。DIA定量蛋白质组
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论