功能基因多样性研究概述
本⽂转载⾃“美吉⽣物”,已获授权。
不知道各位从事或即将从事微⽣物落功能⽣态学研究的⼤虾有没有留意到,通过功能基因扩增⼦测序技术研究微⽣物落功能的⽂章,⼀般多会将测序获得的核酸序列通过特定软件翻译成氨基酸序列后,再进⾏聚类、组成、⽐较、差异、关联和进化等⼀系列分析。
⽐如这篇⽂章:
DOI:10.1038/ismej.2017.97
或者这篇:
多态性的作用
DOI:10.3389/fmicb.2016.01894
⼜或者这篇:
DOI:10.1111/1462-2920.12366
那么问题来了,为什么功能基因扩增⼦测序可(hai)以(yao)使⽤氨基酸序列做分析呢?原因有如下⼏点:
功能⽣态学关注的是功能类的多态性
对核酸序列进⾏有效翻译后可以进⼀步降低分析数据的复杂度
提⾼功能基因的分辨率
序列翻译过程中能够去除(矫正)4种错误序列
嵌合体序列
测序带来的插⼊/缺失导致的移码突变(Frame shift)
包含终⽌⼦的序列
⾮⽬的功能基因序列
因此,功能基因使⽤氨基酸序列分析相较于使⽤核酸序列分析优势尽显!
怎么做呢?Follow me!
下⾯⼩美就给⼤家隆重介绍⼀下结合科研前沿⾃主研发的功能基因使⽤氨基酸序列分析的思路!
本⽅案整体的分析流程如下所⽰
原始数据质控拼接后获得核酸序列优化数据既可以上传I-Sanger平台直接进⾏36项含⾦量⼗⾜的交互分析;也可将核酸优化序列可以翻译成氨基酸序列,后续以氨基酸序列为数据基础分别进⾏Unique氨基酸序列分析和OPU聚类分析等32项前沿的线下功能基因使⽤氨基酸分析。
Unique氨基酸序列:使⽤Framebot软件将核苷酸序列翻译成氨基酸序列后,去除完全重复后的氨基酸序列,直接⽤于物种注释和OPU聚类分析。
OPU:即Operational Protein Unit,将Unique氨基酸序列按照⼀定的相似性阈值进⾏聚类后获得的功能分类单元,挑选每⼀类中丰度最⾼的氨基酸序列作为该OPU的代表序列并进⾏后续各类分析。
产品结构设置
典型分析结果展⽰
指数组间差异检验分析
指数组间差异检验分析通过⽐较不同组间指数的差异显著性,进⽽评估不同组间微⽣物落的丰度和多样性差异。每条柱⼦代表⼀个分组。两组样本⽐较结果(左图),多组样本⽐较结果(右图)。
OPU多度PCA分析
选取⾼丰度或感兴趣的关键OPU,在PCA分析的基础上增加OPU信息,⽐较该OPU在各样本中的多度(多度指落中功能分类的频率分布)排序情况。由不同的样本向各OPU箭头做垂线,如果样本的投影点在箭头的反向延长线上,则表⽰该OPU在此样本中内多度⼩于平均值;反之,则⼤于平均值。
VPA分析
通过VPA分析,⼟壤性质(ENV)与地理因素(GEOL)两类环境因⼦各⾃单独对微⽣物落变化的解释度分别为1%和23%,⼆者共同的解释度为12%,两者未解释的⽐例是64%。
Network⽹络分析
OPU相关性⽹络图中蓝⾊节点表⽰OPU,节点的⼤⼩表⽰OPU的相对丰度⼤⼩。两个节点间连接有线段时,表⽰这两个OPU存在⼀定的相关性,红⾊表⽰正相关,绿⾊表⽰负相关。
系统发⽣进化树(OPU⽔平)分析
选取特定OPU代表序列,并调取该序列在相应功能基因数据库中的Best hit序列共同构建系统发育进化树,进化树中每条树枝代表⼀个物种或OPU。进化分枝上的OPU后的括号中的数字为该OPU的丰度信息,物种进化分枝上后的括号中的数字为该物种对应序列的Accession Number。树枝上数字为bootstrap值。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。