Nature:宏基因组关联分析综述——你想要的全在这
本文转载自“锐翌基因”,已获授权。
Nature于去年7月6日紧随Science4月29日的特刊,推出业内顶级专家主笔的6篇有关“肠道菌-宿主相互作用”的重量级综述和观点透视专辑,提供了肠道菌在多个领域的和临床应用发展中的重要进展。本期专辑的推出,为肠道菌和肠道健康的研究和转化再一次摇旗呐喊。宏基因组关联分析(MWAS)作为微生物组研究的一把利器,正在微生物与疾病研究中发挥越来越重要的作用。今天小锐说事儿便跟大家聊聊6篇雄文中的一篇来自微生物研究领域大牛Jack A. Gilbert(美国环境、医院和家庭微生物组计划发起人,点击名字查看教授简介)主笔的综述文章,有关宏基因组关联分析在疾病领域的研究进展。
文章主旨
本综述总结了疾病相关生物学过程中微生物的作用,并详细介绍了宏基因组关联分析(MWAS)方法以及它在关联微生物与疾病表型中的研究成果。
MWAS与GWAS的异同点
从概念上来说,宏基因组关联分析(MWAS)与全基因组关联分析(GWAS)的确有共同点,都是将某些复杂的特征(比如物种或基因)与表型关联起来。但是,这两者之间存在以下几个非常重要的区别:第一,微生物中的基因数量与人的基因数量比值接近100:1;第二,几乎所有的个体都具有相同的基因,但所携带的微生物种类和基因差异巨大;第三,人体的基因表达量很容易计算,而大部分微生物组数据只能通过相对丰度进行量化。因此,微生物组分析很有难度;第四,人体基因组是不会改变的(除癌症等特殊情况),而个体所携带的微生物组在不断变化。
快速了解MWAS
1.MWAS能够将物种注释到种水平,对基因进行预测及功能注释,另外还有少部分转录本和蛋白相关的分析。
2.宏基因组测序和组装为确保样品间的比较有意义,首先应保证足够测序数据量,因为被检测到的基因数会随着测序数据量的增加而增加,直到饱和。与从肠粘膜、口腔、皮肤、阴道和胎盘这些部位采集的样品相比,粪便样品宿主污染比较少,不超过总数据量的1%。经过质控,测序得到的序列(reads)被重新组装成更长的序列(contigs),这些contigs共同组
成宏基因组。
3.微生物参考基因集通过对组装后的contigs进行基因预测,并去除样品间高度相似的基因序列,得到非冗余基因集。基因的丰度、分类和功能都是基于这个参考基因集而被量化,从而进行微生物与疾病之间的关系研究。因此,建立一个高质量的参考基因集是MWAS的基础。
4.基于宏基因组数据的分类不同样品中来自相同微生物基因组的一类基因应该具有相同的丰度变化模式,可根据这一原理对宏基因组数据集中的基因进行聚类,将物种分辨率提高到菌株水平。基于不同的相关系数和算法,这些聚类方法包括建立MLG(metagenomic linkage groups)、MGC(metagenomic clusters)或MGS(metagenomic species)。在物种注释时,基于保守的单拷贝基因和基因组的菌株特异性区域进行比对非常有效。例如,宏基因组操作分类单元法(mOTU)就是基于十个保守的单拷贝基因进行物种注释,因此,比利用16S rDNA在物种比对上更准确。
5.MWAS对微生物组的分析是基于整体的概念,采取降维的思想,将多维因素下数据的差异展示在二维坐标上。一般通过聚类分析、主坐标分析(PCoA)、主成分分析(PCA)、一致性分析、因子分析和判别分析来实现降维。
图1. 通过MWAS关联微生物与疾病
微生物在疾病领域研究进展
MWAS是通过研究特定环境中的微生物将疾病与微生物关联起来。那目前疾病领域微生物研究进展如何?我们一起来回顾一下。
微生物标记物
现在大部分的研究都是通过鉴定微生物落结构的改变来区分患病风险人与健康人。
(1)微生物多样性分析很多疾病研究都是基于微生物落的相似性来区分不同的样品。然而,度量标准,如统计学模型的选择对结果的影响很少受到重视。对于一组特征多样化的样品,例如,来源于不同人的皮肤样品,即使通过统计学模型能够揭示原始数据的差异,但很有可能这种差异与生物学上的差异不一致。另外,从微生物复杂的潜在作用关系中提取出与研究相关的网络至关重要。比如鉴定出克罗恩病患者体内有益和有害的微生物相互作用关系。但这种方法存在两个问题:第一,通过多项分布得到的个别微生物的富集会产生很多负相关关系,从而引起网络拓扑结构的偏好性;第二,分类数据非常稀少,某个特定微生物在
大部分样品中没有富集。在物种注释方面,宏基因组学比扩增子测序更精确。不过,通过寡核苷酸配型技术(oligotyping)对16S rDNA测序数据进行再分析,能够提高物种鉴定的分辨率。然而,不是分辨率越高分类结果就越准确,比如16S rDNA分析中分类到种水平的OTU在区分胖人与瘦人时的准确性反而有所降低。
(2)功能分析宏基因组学通过对特定环境中所有的DNA片段进行测序,故能够提供更完整的微生物落信息以及很多更强大的分析。比如对物种的鉴定到菌株水平或单核苷酸多态性(SNPs),基于KEGG(Kyoto Encyclopedia of Genes and Genomes)、COG (Clusters of Orthologous Groups of Proteins)、GO (Gene Ontology)和EggNOG (Evolutionary Genealogy of Genes: Non-supervised Orthologous Groups)等数据库对DNA序列进行功能聚类。
结合人类基因多态性宏基因组与代谢组学数据在区分不同疾病特征方面很有优势(图2),除了能够提高物种鉴定的分辨率,也有助于揭示某现象的潜在机理,比如解释粪菌移植艰难梭菌如何改变小鼠胆汁酸代谢产物的研究。宏蛋白质组学也可以鉴定新的生物标记物,已有报道称乳酸脱氢酶、精氨酸脱亚胺酶以及参与胞外多糖合成、铁代谢和免疫应答过程中的酶,能够作为
健康人口腔环境中的标记物。结合宏基因组学、代谢组学和蛋白质组学已经揭示出微生物如何应对特定的疾病状态,比如IBD,并到参与丁酸盐和胆汁酸代谢过程中的特定物种(例如Faecalibacterium、prausnitzii)、蛋白和代谢产物,这些均可作为区分克罗恩病引起的回肠炎症、结肠炎症以及健康人肠道的生物标记物。
Nature. 2016 Jul 6;535(7610):94-103图2. 人类微生物组的代谢产物来源
MWAS在微生物-疾病研究中的成果表1. 宏基因组关联分析在疾病领域的研究成果
Nat Rev Microbiol. 2016 Aug;14(8):508-22.
从相关关系到因果关系
想要明确疾病的发病机理,仅停留在微生物与疾病的相关关系上远远不够。到目前为止,最大的挑战就是超越微生物与疾病状态的相关性,建立它们之间的因果关系。case–control模型的限制就是不能确认是微生物落的变化引起疾病,还是疾病引起了微生物落变化,又或是这两者作为混合因素引起了两者状态的改变。
目前的几个用于鉴定微生物与疾病因果关系的研究方法均存在优势与缺陷。纵向研究,比如CHILD(Canadian Healthy Infant Longitudinal Development)出生队列研究,能够检测微生物的变化在疾病发生之前还是之后,然而这项研究非常昂贵,且需要大量的人样本。干预研究可以通过药物管理或其它干预方式来引起微生物和疾病表型的改变,这种方法非常有效,但存在伦理问题。比如粪菌移植就面临很多障碍,尤其在美国。另外,人样本很难采集,并存在很多隐私问题,特别是有些样本被用于很多不同的研究。动物模型虽然在探究疾病发生机理方面有很大的应用价值,但这些机理与人类疾病之间的关系还有待明确。
代谢组揭示重要的微生物活动
由于代谢过程的变化非常快,能够同时揭示出宿主和微生物的生理状态,代谢组生物标记物在疾病诊断方面具有重要作用。人体微生物组所产生的小分子由四组构成。第一组是分解代谢和合成代谢产生的初级代谢物,主要用于细胞生长和维持体内稳态。第二组包含一些特定代谢物,包括毒力因子、二级代谢物和自然产物。研究二级代谢物的变化可以帮助人们理解食物中的毒素、体感应和有益的代谢物。第三组是宿主产生的代谢物或受到微生物酶修饰而产生的化学产品。研究第三组代谢物的变化,有助于理解微生物如何影响宿主的代谢产物。
第四组是个人护理产品、药物干预、食物或外界环境作用下所产生的化学过程和代谢产物。研究第四组代谢物的变化有利于理解这些化合物是怎样作用于机体从而引起有害反应或其它形式的变化。
越来越多的研究表明微生物的代谢物能够直接影响人体健康,例如 SCFAs(短链脂肪酸)对IBD发生、发展的影响。MassBank、METLIN、MetaboLights和HMDB(the Human Metabolome Database,人类代谢组数据库)等数据库依次出现,旨在储存和传播质谱分析获得的数据,使得更多代谢物被注释。无菌动物的使用在鉴定宿主微生物所产生的初级代谢物中具有重要作用,但很多代谢物在人类健康中的作用还有待研究。另外,微生物的致病要素可能是编码特定代谢物的基因,而非致病物种的核心基因(图2)。因此,微生物相关疾病的研究也可以从研究这些基因的角度出发。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论