KEGG简介
KEGG(Kyoto Encyclopedia of Genes and Genomes)是系统分析基因功能、基因组信息数据库,它有助于研究者把基因及表达信息作为一个整体网络进行研究。基因组信息存储在GENES数据库 里,包括完整和部份测序的基因组序列;更高级的功能信息存储在PATHWAY数据库里,包括图解的细胞生化进程如代谢、膜转运、信号传递、细胞周期,还包 括同系保守的子通路等信息;KEGG的另一个数据库是LIGAND,包括关于化学物质、酶分子、酶反映等信息。能够免费获取。KEGG提供的整合代谢途径 (pathway)查询十分超卓,包括碳水化合物、核苷、氨基酸等的代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,而且对催化各步反映的酶进行 了全面的注解,包括有氨基酸序列、PDB库的链接等等。KEGG是进行生物体内代谢分析、代谢网络研究的强有力工具。
KEGG简介
KEGG简介一、KECC概况(全基因组及代谢途径数据库)pdb文件阅读器安卓
尽管决定生物体基因分类的基因组测序工程有了飞速的进展,但对单个基因功能的研究仍然相差甚远。同时活细胞的生物学功能是许多分子彼此作用的结果,不能仅仅归功于单个基因或单个分子。日本教育、科学、体育、文化部人类基因组打算于1995年5月成立了KEGG工程。KEGG将基因组信息和高一级的功能信息有机地结合起来,通过对细胞内已知生物学进程的运算机化处置和将现有的基因功能说明标准化,对基因的功能进行系统化的分析。KEGG的另一个任务是一个将基因组中的一系列基因用一个细胞内的分子彼此作用的网络连接起来的进程,如一个通路或是一个复合物,通过它们来展现更高一级的生物学功能。
其目的是由细胞或生物体的基因组信息去了解其较高层次的功能与作用之生物信息资源,也确实是整理显现存的调控网络,并成立其中每一个组件与基因间的关系,一但研究者
到 基因即可透过KEGG,让研究者由基因组至细胞层次做一整合性连结,并对生命现象做in silico 分析。尽管 KEGG 的工作受到确信,但距离理想目标还有一大段距离,因为反映途径图上的每一个关系都应有文献资料做后盾,咱们不能只相信一张可能带有个人成见的途径图。目前 数据库中虽已成立各基因与其它数据库的关系,但它缺少的是讨论到途径正确性或调控机制的数据。
KEGG是基因组破译方面的数据 库。在后基因时期一个重大挑战是如何使细胞和有机体在运算机上完整的表达和演绎,让运算机利用基因信息对更高层次和更复杂细胞活动和生物体行为做出计算推 测。为达到此目的,人们成立了一个在相关知识基础上的网络推测计算工具。在给出染体中一套完整的基因的情形下,它能够对蛋白质交互(互动)网络在各类细 胞活动起的作用做出预测。
二、KEGG的组成
KEGG此刻由6个各自独立的数据库组成,别离是基因数据 库(GENES database)、通路数据库(PATHWAY database)、配体化学反映数据库(NGAND database)、序列相似性数据库(SSDB)、基因表达数据库(EXPRESSION)、蛋白分子彼此关系数据库(BRITE)等。
1.基因数据库(GENES database) 含有所有已知的完整的基因组和不完整的基因组。有细菌、蓝藻、真核生物等生物体的基因序列,如人、小鼠、果蝇、Arabidopsis等等。总共240943个条款,其总的条款数远远大于SWISS—PROT数据库。基因数据库(GENES database)含有关于每一个基因的最低限度的信息,而且在不断地更新和改良,同时还可作为通往其他相关信息的途径。
2.通路数据库(PATHWAY database) 贮存了基因功能的相关信息,通过图形来表示细胞内的生物学进程,例如代谢,膜运输,信号传导和细胞的生长周期。在通路数据库(PATHWAY database)中,有一部份由ortholog group图表组成的保守的亚通路(通路基序)信息。亚通路是由染体位置偶联的基因编码的,它对预测基因的功能有专门大的作用。
(1)代谢通路:目前在通路数据库(PATHWAY database) 中代谢通路是成立得最好的,有大约90个参考代谢途径的图形。每一个参考代谢途径是一个由酶或EC号组成的网络。利用如下方式可通过运算机构建诞生物体特有 的代谢通路:先依照基因的序列相似性和位置相关性确信基因组中酶的基因,然后合理地安排EC号,最后将基因组中的基因和参照通路顶用EC号编号的基因产物 结合起来。图4—5—19为通路数据库的页面尔例。
(2)Ortholog group图表:在KEGG中目前有83个ortholog图表。Ortholog对单个基因的序列的相似性进行识别,检查功能组(如保守的亚通路或分子 复合物)中所有组分。KEGG ortholog grope图表表达了三个特点:①一个生物体是不是具有组成一个功能组的完整基因;②这些基因是不是偶联在染体上;③在不同生物体中的 orthologous基因是什么。例如在基因组中的一个基因簇编码代谢通路中的功能相关的酶簇。在KEGG中,如此的相关簇第一被一个启发式的图表比较 算法检测,然后手工编辑为ortholog group图表。现有两种类型的图表比较法,基因组—通路和基因组—基因组比较法。一个ortholog grope图表是
如此一组比较的组成部份,它代表了一个通路的保守的部份,也确实是通常说的通路基序。
(3)蛋白—蛋白反映:KKGG通路表达的重点在于由基因产物的组成的网络上,其中包括大多数蛋白和功能性RNAs。代谢通路是蛋白—蛋白的间接彼此作用(事实上是酶—酶彼此作用)形成的网络。而调剂通路是蛋白—蛋白的直接彼此作用(如结合,磷酸化)和另一种蛋白—蛋白的间接彼此作用(通过基因表达与转录因子及基因的翻译产物相关联)组成的网络。一样的蛋白—蛋白的彼此作用包括了上面所述的这三种形式的彼此作用,它是一个抽象的网络,可是它在与基因组信息的连接中起到关键作用,如此网络中的节点(基因产物)与基因织中的节点(基因)就能够够直接相连。有了如此一个蛋白—蛋白彼此作用的网络,就能够够增加手工绘制的参考通路图了。
3.配体数据库(LIGAND database) 包括了细胞内的化学复合物,酶分子和酶反映的信息。
三、KEGG的利用
KEGG提供了java的图形工具用于阅读基因组图谱,比较两个基因组图谱,操作表达图谱,还可作为比较序列、图表、通路的计算工具。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论