QIIME2使用方法--688IT编程网

QIIME2使⽤⽅法

激活qiime2的执⾏环境：source activate qiime2-2019.4

如何查看conda已有的环境：conda info -e

以下分析流程参考：/2019.4/tutorials/qiime2-for-experienced-microbiome-researchers/

1、数据准备

现在我们常⽤的就是这种格式的数据，每个样品⼀对数据⽂件

wget \

-O "casava-18-paired-end-demultiplexed.zip" \

"/2019.4/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

下载解压后，⽂件夹中⽂件如下：

2、将数据转换为qza格式（qiime新定义的⾃⼰的格式类型，有点编程中对象的含义）

qiime tools import \

--type 'SampleData[PairedEndSequencesWithQuality]' \

--input-path casava-18-paired-end-demultiplexed \

--input-format CasavaOneEightSingleLanePerSampleDirFmt \

--output-path demux-paired-end.qza

3、查看数据质量

qiime demux summarize --i-data demux-paired-end.qza --o-visualization demux-summary-1.qzv

⽤以下命令查看结果：

qiime tools view demux-summary-1.qzv

4、双端序列合并成单端

qiime vsearch join-pairs --i-demultiplexed-seqs demux-paired-end.qza --o-joined-sequences demux-joinded.qza

5、查看对merge后的数据质量情况

qiime demux summarize --i-data demux-joinded.qza --o-visualization demux-summary-merged.qzv

qiime tools view demux-summary-merged.qzv

> 以下是使⽤dada2进⾏数据去噪，本教程先跳过该步，之后有专门教程介绍dada2使⽤

4、对数据进⾏剪切

双端：

qiime dada2 denoise-paired \

--i-demultiplexed-seqs demux-paired-end.qza \

--p-trim-left-f 13 \

--p-trim-left-r 13 \

--p-trunc-len-f 150 \

-p-trunc-len-r 150 \

--o-table table.qza \

--o-representative-sequences rep-seqs.qza \

--o-denoising-stats denoising-stats.qza

单端：

qiime dada2 denoise-single \

--i-demultiplexed-seqs demux-joinded.qza \ #输⼊应该也是序列，不能是joined对象

--p-trim-left 13 \

--p-trunc-len 150 \

--o-table table.qza \

--o-representative-sequences rep-seqs-merged.qza \

-o-denoising-stats denoising-stats-merged.qza

以下参考：

5、序列质控

qiime quality-filter q-score-joined \

--i-demux demux-joinded.qza \

--o-filtered-sequences demux-joined-filtered.qza \

--o-filter-stats demux-joined-filter-stats.qza

输出结果:

demux-joined-filter-stats.qza: 统计结果

demux-joined-filtered.qza: 数据过滤后结果

6、⽤deblur去冗余，并⽣成特征表（相当于QIIME1的OTU Table）

qiime deblur denoise-16S \

--i-demultiplexed-seqs demux-joined-filtered.qza \

--p-trim-length 250 \

--p-sample-stats \

--o-representative-sequences rep-seqs.qza \

--o-table table.qza \

--o-stats deblur-stats.qza

输出结果:

rep-seqs.qza: 代表序列

deblur-stats.qza: 统计过程

table.qza: 特征表

备注：

由于DADA2和Deblur产⽣的“OTU”是通过对唯⼀序列进⾏分组⽽创建的，因此这些OTU相当于来⾃QIIME 1的100%相似度的OTU，通常称为序列变体。在QIIME 2中，这些OTU⽐QIIME 1默认的97%相似度聚类的OTU具有更⾼的分辨率，并且它们具有更⾼的质量，因为这些质量控制步骤⽐QIIME 1中实现更好。因此，与QIIME 1相⽐，可以对样本的多样性和分类组成进⾏更准确的估计。

7、查看deblur去冗余后的特征表

qiime feature-table summarize \

--i-table table.qza \

--o-visualization table.qzv

--m-sample-metadata-file sample-metadata.tsv

qiime feature-table tabulate-seqs \

--i-data rep-seqs.qza \

-o-visualization rep-seqs.qzv

qiime tools view table.qzv

8、统计每个样品包含的序列数

qiime deblur visualize-stats \

--i-deblur-stats deblur-stats.qza \

--o-visualization deblur-stats.qzv

qiime tools view deblur-stats.qzv

9、构建进化树⽤于多样性分析

qiime phylogeny align-to-tree-mafft-fasttree \

--i-sequences rep-seqs.qza \

--o-alignment aligned-rep-seqs.qza \

-o-masked-alignment masked-aligned-rep-seqs.qza \

--o-tree unrooted-tree.qza \

--o-rooted-tree rooted-tree.qza

11、计算核⼼多样性

qiime diversity core-metrics-phylogenetic \

--i-phylogeny rooted-tree.qza \

--i-table table.qza \

--p-sampling-depth 500 \

--m-metadata-file sample-metadata.tsv \

--output-dir core-metrics-results

分析结果包含：

α多样性

⾹农(Shannon’s)多样性指数（落丰富度的定量度量，即包括丰富度richness和均匀度evenness两个层⾯）

Observed OTUs（落丰富度的定性度量，只包括丰富度）

Faith’s系统发育多样性（包含特征之间的系统发育关系的落丰富度的定性度量）

均匀度（或 Pielou’s均匀度；落均匀度的度量）

β多样性

Jaccard距离（落差异的定性度量，即只考虑种类，不考虑丰度）

Bray-Curtis距离（落差异的定量度量）

⾮加权UniFrac距离（包含特征之间的系统发育关系的落差异定性度量）

加权UniFrac距离（包含特征之间的系统发育关系的落差异定量度量）

β多样性分析结果-PCoA：

12、Alpha多样性组间显著性分析和可视化

qiime diversity alpha-group-significance \

--i-alpha-diversity core-metrics-results/faith_pd_vector.qza \

--m-metadata-file sample-metadata.tsv \

--o-visualization core-metrics-results/faith-pd-group-significance.qzv

qiime diversity alpha-group-significance \

--i-alpha-diversity core-metrics-results/evenness_vector.qza \

--m-metadata-file sample-metadata.tsv \

--o-visualization core-metrics-results/evenness-group-significance.qzv

13、绘制稀疏曲线

qiime diversity alpha-rarefaction \

-i-table table.qza \

--i-phylogeny rooted-tree.qza \

--p-max-depth 1000 \

--m-metadata-file sample-metadata.tsv \

--o-visualization alpha-rarefaction.qzv

--p-max-depth参数的值应该通过查看上⾯创建的table.qzv⽂件中呈现的“每个样本的测序量”信息来确定。⼀般来说，选择⼀个在中位数附近的值似乎很好⽤。

14、物种组成分析

下载物种注释数据库制作的分类器：

wget \

-O "gg-13-8-99-515-806-nb-classifier.qza" \

"/2018.11/common/gg-13-8-99-515-806-nb-classifier.qza"

物种注释和可视化

qiime feature-classifier classify-sklearn \

--i-classifier gg-13-8-99-515-806-nb-classifier.qza \

tabletable--i-reads rep-seqs.qza \

--o-classification taxonomy.qza

qiime metadata tabulate \

--m-input-file taxonomy.qza \

--o-visualization taxonomy.qzv

⽣成物种组成柱状图：

qiime taxa barplot \

--i-table table.qza \

-i-taxonomy taxonomy.qza \

--m-metadata-file sample-metadata.tsv \ --o-visualization taxa-bar-plots.qzv

米酒感官评价标准参考

« 上一篇

雅思写作考题汇总;小作文

688IT编程网

QIIME2使用方法

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

QIIME2使用方法

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法