GenBank 中字符的意思
Nucleotide 数据库分为三个子数据库:
·EST :表达序列标记数据库
·GSS :基因组测序序列数据库
·CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列
● MeSH: 查询缩写基因的全称
3、RefSeq(Reference Sequence)序列接受号:
(1)mRNA 记录(NM_*):
e。g。:NM_000492
(2)基因组的DNA重叠(NT_*):
e.g。:NT_000347
(3)完整的基因组或染体(NC_*):include啥意思
e。g。:NC_000907
(4)基因组的局部区域(NG_*):
e。g。:NG_000019
(5)从人类基因组注释、加工得到的序列模型(XM,XP,or XR_*):
e。g。:XM_000483
● GenBank记录中特性表中的主要关键词:
关键词 | 解 释 | 关键词 | 解 释 |
misc_feature | 生物学特性无法用特性表关键词描述的序列 | promoter | 转录起始区 |
misc_difference | 序列特性无法用特性表关键词描述的序列 | CAAT_signal | 真核启动子上游的CAAT盒,与RNA结合相关 |
conflict | 同一序列在不同的研究中在位点或区域上有差异 | TATA_signal | 真核启动子的TATA盒 |
unsure | 序列不能确定的区域 | —35_signal | 原核启动子中的—35框 |
old_sequence | 该序列对以前的版本做过修订 | —10_signal | 原核启动子的Pribow盒 |
variation | 包含稳定突变的序列 | GC_signal | 真核启动子的GC盒 |
modified_base | 修饰过的核苷酸 | RBS | 核糖体结合位点 |
gene | 已识别为基因或已命名的序列区域 | polyA_signal | RNA转录本的剪切识别位点 |
misc_signal | 无法用信号特性关键词描述的信号序列 | enhancer | 增强子 |
关键词 | 解 释 | 关键词 | 解 释 |
attenuator | 与转录终止有关的序列 | CDS | 蛋白质编码序列 |
terminator | 转录终止序列 | sig_peptide | 编码信号肽的序列 |
rep_origin | 双链DNA复制起始区 | transit_peptide | 转运蛋白编码序列 |
misc_RNA | 无法用RNA关键词描述的转录物或RNA产物 | mat_peptide | 编码成熟肽的序列 |
prim_transcript | 初始转录本 | intron | 内含子 |
precursor_RNA | 前体RNA | polyA_site | RNA转录本的多聚腺苷酸化位点 |
mRNA | 信使RNA | rRNA | 核糖体RNA |
5’clip | 前体转录本中被剪切掉的5’端序列 | tRNA | 转运RNA |
3’ clip | 前体转录本中被剪切掉的3'端序列 | scRNA | 小细胞质RNA |
5’UTR | 5’非翻译区 | snRNA | 小核RNA |
3’UTR exon | 3'非翻译区 外显子 | snoRNA | 加工和修饰rRNA的小核RNA |
关键词 | 解 释 | 关键词 | 解 释 |
immunoglobulin_related | repeat_unit | 单个的重复元件 | |
C_region | 免疫相关蛋白上的不变区 | LTR | 长末端重复序列 |
D_segment | 免疫球蛋白重链的可变区, T细胞受体β链 | Satellite | 卫星重复序列 |
J_ segment | 免疫球蛋白重链、轻链以及T细胞α、β、γ的结合链 | misc_binding | 无法描述的核酸序列结合位点 |
N_ region | 插入重排免疫球蛋白片段间的核苷酸 | primer_bind | 复制、转录的引物结合位点 |
S_ region | 免疫球蛋白重链的开关区 | protein_bind | 蛋白质结合区 |
V_ region | 编码免疫球蛋白的可变区N末端的序列 | STS | 测序标签位点 |
V_ segment | 编码免疫球蛋白的可变区的序列 | misc_recomb | 无法用重组特性关键词描述的重组事件 |
repeat_region | 基因组中所包含的重复序列 | iDNA | 通过重组所消除的DNA |
misc_structure | 无法用结构关键词描述的核酸序列高级结构或构型 | stem_loop | 发夹结构 |
D_loop | 线粒体中DNA中的取代环 | ||
◆GenBank记录中特性表中的限定词:
限定词 | 含 义 | 限定词 | 含 义 |
/allele= | 给定基因的等位基因 | /codon_start= | 相对于序列第一个碱基,编码序列密码子的偏移量 |
/bound_moiety= | 嵌合范围 | /country= | DNA样本的来源国 |
/cell_type= | 获得序列的细胞类型 | /db_xref= | 其他数据库信息的交叉索引号 |
/citation= | 已被引用的参考文献数 | /direction= | DNA复制方向 |
/clone_lib= | 获得序列的克隆文库 | /environmental_sample= | 序列直接从环境材料中获得而没有指明来源物种 |
限定词 | 含 义 | 限定词 | 含 义 |
/exception= | 指明DNA序列未按通常的生物学规律翻译,如RNA编辑 | /PCR_conditi—ons= | 描述PCR的反应条件 |
/frequency= | 在种中发生变异的频率 | /pop_variant= | 获得序列的体变异种名称 |
/germline | 如果序列是DNA并来源于免疫球蛋白家族,则表示该序列来源于未重排DNA | /product= | 序列编码产物的名称 |
/insertion_seq= | 序列来源于某种插入元件 | /anticodon= | tRNA反义密码子的位置及它所编码的氨基酸 |
/isolate= | 序列来源的生物个体 | /cell_line= | 获得序列的细胞系 |
/lab_host= | 为扩增序列来源物种所用的实验室宿主 | /chromosome= | 获得序列的染体 |
/macronuclear | 指明DNA来源于染体分化的大核期 | /clone= | 获得序列的克隆子 |
/note= | 评论及附加信息 | /codon= | 指出与参考密码子不同的密码子 |
/organelle= | 获得序列的细胞器 | /EC_number= | 序列产物的酶学编号 |
/sub_strain= | 获得序列的来源微生物亚种 | /transl_table= | 描述在翻译中与通用密码表不同的密码表 |
/tissue_type= | 获得序列组织类型 | /usedin= | 表明该特性在其他检索中也被使用 |
/translation= | 按通用或指定的密码子表翻译的氨基酸序列 | /virion | 病毒颗粒 |
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论