单个基因的⽣物信息学分析(1)-基因结构与功能分析
在⽣物学分析中,我们经常会针对某个基因进⾏⽣物学功能分析,⽐较常见的包括基因结构预测,功能注释,蛋⽩质结构域预测(跨膜域,信号肽),同源基因分析,多序列⽐对,亚细胞定位预测,启动⼦序列分析,调控靶基因的miR N A预测等。在“单个基因的⽣物信息学分析”主题中,我们主要使⽤的是在线⽹站,⼏乎不涉及编程等操作,这样会使跟多的同学可以⽅便学习。
⼀、针对⼀个特定的基因序列,⾸先我们要分析其基因结构。这⾥我们推荐的是so ftberry
ftber ry ⽹站的⼦功能,即FGEN ESH。
该分析⼯具的⽹址如下FGENESH - HMM-based gene structure prediction
进⼊该⽹址之后,输⼊该基因的fasta序列,关于⽬标基因的fasta序列,fig.1即为所⽰,我们以⼩麦中的基因为例分析。
图1
根据fig.2所⽰,将fasta序列输⼊进去,选择⼩麦(triticum aestivum),然后search。
图2
图3展⽰了分析结果,可以看到我们这个序列⽐对到了正义链,因为我们⽤的例⼦是该基因的转录本,所以只包括黄⾊的部分,即CDSo序列,这也和我们使⽤的转录本相吻合。下⾯的是该基因对应的mRNA序列,同样也是1152bp,最下⾯的是将该mRNA翻译为蛋⽩质的序列。
图3
⼆、如果我们是想分析⼀段区间内的基因结构,例如⼏k b,⼏⼗k b,⽽不是针对特定的基因分析,同样也可以使⽤该⽹址。这⾥我们使⽤的是FGEN ESH的⽰例⽂件。
图4
同样选择好序列和物种,搜索,等待结果。
图5是分析结果,⼀共鉴定了10个基因,21个外显⼦,由于篇幅所限,我们只展⽰了前⼏个,但是统计的话,正好能对上数⽬。
图5
图6是紧接上图的具体的序列分析,总共包含10个基因。
图6
三、基于以上分析,我们可以初步得到⼀段区间内的基因结构分析,也可以进⾏单个基因的结构分析。完成基因结构分析之后,可以利⽤nc bi的bla st,或者ensemble pla nt进⾏功能注释,如果是使⽤氨基酸序列,选择bla stp,如果是基因序列,选择bla stn。图7显⽰的是ensemble pla nt的bla st,查看其在拟南芥中的同源基因。在这⾥,我⽐较推荐使⽤ensem ble pla nt进⾏bla st,因为该⽹址更简洁,明了。
ensemble pla
图7
图8可以看到该基因在拟南芥中的同源基因,具体的⽣物学注释,就要看⾃⼰对这个基因的了解程度了。
可以学习编程的网站图8
以上,就是我们这次对某段未知的基因区间以及某个特定的基因,进⾏结构分析和功能注释。欢迎各位⼩伙伴点赞,收藏和留⾔讨论。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。