image
16S rDNA序列结构
2、OTU
OTU即Operational Taxonomic Units的缩写(千万表⼿滑写成OUT,否则就OUT了),在系统发⽣学或体遗传学研究中,为了便于进⾏分析,⼈为给某⼀个分类单元(品系,属,种、分组等)设置的同⼀标志。理论上⼀个OTU代表⼀个微⽣物物种。
通过测序获得的⼤量reads,如何才能转变为我们需要的物种信息呢?⾸先需要对这些reads进⾏归类(cluster),通常在97%的相似⽔平划分为不同的OTU,将OTU代表序列与相应的微⽣物数据库⽐对(Silva、RDP、Greengene等),得到每个样本所含的物种信息,进⽽进⾏后续⽣物信息统计分析。
3、Q值
Q值评估⽤来测序的碱基质量,Q值与测序错误E值之间关系为如果⼀个碱基的Q值为20,那表⽰这个碱基的可能测错的可能性为1%。实际操作中常⽤Q20/Q30作为标准,Q20⼤于90%妥妥的。
image
4、Coverage
Coverage值是指各样本⽂库的覆盖率,数值越⾼,则样本中序列被检测出来的概率越⾼,该数值可反映本次测序结果是否代表样本的真实情况。数值越接近于100%,代表本次测序结果越符合样本中微⽣物的实际情况。
5、Alpha-diversity
Alpha多样性⽤于度量落⽣态单样本的物种多样性,是反映丰富度和均匀度的综合指标。
菌丰富度(Community richness)指数有:Chao、Ace,Chao或Ace指数越⼤,说明菌丰富度越⾼。
菌多样性(Community diversity)指数有:Shannon、Simpson,Shannon值越⼤,说明落多样性越⾼;Simpson指数值越⼤,说明菌多样性越低。
根据各样本⽣成的OTU,对样本序列进⾏随机取样,以取出的序列数及这些序列所能代表的OTU数构建曲线,计算样本的Alpha多样性。
通常Alpha多样性指数均以表格形式呈现,这显然不利于论⽂颜值的提升,那么可以将Alpha多样性指数结合起来,出个箱线图(Box-plot)或可
有所帮助。
image
6、Beta-diversity
Beta多样性⽤于不同⽣态系统之间多样性的⽐较,利⽤各样本序列间的进化关系及丰度信息来计算样本间距离,反映样本(组)间是否具有显著的微⽣物落差异。⽬前应⽤⽐较多的是PCA、PCoA、NMDS分析等。由于微⽣物多样性研究通常会涉及到⼤样本数量的样本,因此通过Beta-diversity分析可以直观地反映样本组间的差异情况。距离越远,微⽣物落差异越⼤,即相似性越⾼。
7、LEfSe
htmlborderLEfSe分析即LDA Effect Size分析,多⽤于多个分组(≧2)之间的⽐较,或者进⾏亚组⽐较分析,进⽽到组间在丰度上有显著差异的物种(biomaker)。
基本过程是⾸先在多组样本中采⽤⾮参数因⼦Kruskal-Wallis秩和检验检测不同分组间丰度差异显著的物种;然后基于获得的显著差异物种,利⽤成组的Wilcoxon秩和检验进⾏组间差异分析;最后采⽤线性判别分析(LDA)对数据进⾏降维并评估差异显著的物种的影响⼒⼤⼩(即LDA score)。
LEfSe分析包含了不同分类学⽔平(门到属或者种)的物种信息,并且是显著差异的物种,因⽽是⼀项信息量⼤、采⽤率(biger)⾼的分析,值得拥有~~~
image 16S分析流程
image
建库测序暂且跳过,⼀下是我们拿到测序数据后的分析步骤:
1. 过滤Filter
2. 连接Connect Tags
3. 聚类OTU Cluster
4. 分类Taxonomy
5. 多样性Alpha_Beta
6. 。。。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论