翻译蛋白的基因序列提交NCBI教程
说明:在上传编码蛋白质的基因到NCBI时,定义基因的CDS区段是非常重要的一步,也是大多数学生所迷茫和不会的地方。那么,在基因序列上传时,大家还在发愁序列的CDS 编码区段是从多少位碱基到哪吗?这篇教程给大家详细的演示了如何定义手中序列的CDS 区段,轻松上传序列。
注:大家都知道像ITS,18S,28S等这些序列片段不是基因,它们是不翻译蛋白质的,这个教程教大家如何提交能翻译蛋白的基因序列。bank文件
提交通道:通过NCBI内的BanKIt进行提交。
1.打开NCBI主页,在搜索框内输入“BankIt”,见下图1
2.搜索结果见下图2
3.进入后进行登录,用NCBI的账号和密码登录(注:如果没有,可以使用邮箱注册),
登录后的页面见下图3,根据需要点击相应按钮开始进入序列提交界面(注:也可点击下图红框圈出的位置)
4.我们需完成如下图4中的8个步骤,即可完成提交
5.完成第一步的Contact Information后,第二步的Reference我们需要填写如下图5的信息
6.Sequencing Technology选项,填写如下图6
7.Nucleotide(这一步需要我们准备上传的序列文件)
a.序列文件类型为fasta文件,我们需要先对序列进行定义(也就是介绍该序列,可以
先将自己的序列在NCBI里Blast一下,然后再点开Query Cover(可理解为覆盖度)和Per. Ident(可理解为匹配度)都非常高的那个网上的参考序列,然后复制该参考序列的定义内容即可,见下图7-1)
b.然后粘贴成为我们手中的序列定义,见下图7-2(注:不要忘记将菌株号改为自己的
菌株号,序列开端一定要是“>Seq1 [organism=genus species]”,其中的Seq1可以用你的菌株号,也可以随意编号,只要你自己知道就可,方括号[xxxx]内填写自己序列的菌的拉丁名)
c.准备好序列后,我们勾选如下图7-3的选项
d.然后这个序列就可以载入了(点击Upload file),或者直接粘贴该序列,见下图7-4
单个序列的界面
注:这一步上传序列时你也可以将多条序列,包括不同基因的序列都可以准备到同一个fasta文件里,载入后再选择“Batch”(批量提交的意思),界面见下图7-5
e.点击Continue
8. Organism这一项需输入咱们的菌拉丁名,见下图8
9. Submission Category 如下图9
10. Source Modifiers 这一项需要我们输入一些有关咱们的菌的信息,如采集国家,采集人,,isolate,时间等信息,见下图10
11. Features (Overview) 这一项是非常重要的一项,也是大家经常有问题的一项,一定要认真学。编码蛋白的序列提交界面需勾选如下选项,再点击Add,见图11-1

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。