SRA数据库帮助
1.简介.............................................................................................................................. - 1 -
2.数据库查询与结果展示.............................................................................................. - 1 - 2.1.Run数据搜索与结果展示 ..................................................................................... - 1 - 2.2.Sample数据搜索与结果展示 ............................................................................... - 3 - 2.
3.Experiment数据搜索与结果展示......................................................................... - 4 -
2.4.Study数据搜索与结果展示................................................................................... - 5 -
3.数据下载...................................................................................................................... - 5 -
4.数据提交...................................................................................................................... - 6 -
5.数据格式...................................................................................................................... - 6 -
6.常见问题...................................................................................................................... - 8 -
7.附录.............................................................................................................................. - 9 - 7.1.GS FLX系统超高通量测序................................................................................... - 9 - 7.2.Solexa 高通量测序法原理.................................................................................. - 10 - 7.3.HeliScope测序技术简介..................................................................................... - 11 -
2008年11月17日
1. 简介
近年来,随着科技的进步,新一代大规模平行测序技术诞生了,如454、Solexa和HeliScope等。这些测序技术可以同时对大量的短片段测序,由于其数据的复杂性及结果的高通量性,使原有的数据库不能适应新的测序结果。而一些小型实验室自身也不具备处理和管理这些复杂数据的能力。因此生命数据中心创建了SRA数据库,帮助用户管理这些测序数据,同时有助于科研界共享数据。
SRA与Trace最大的区别是将实验数据与元数据分离。元数据现在可以划分为以下几类。
• Study--study包含了项目的所有metadata,并有一个NCBI和EBI共同承认的项目编号(universal project id),一个study可以包含多个实验(experiment)。
• Experiment--一个实验记载实验设计(Design),实验平台(Platform)和结果处理(processing)三部分信息,并同时包含多个结果集(run)。
• Run--一个结果集包括一批测序数据。
• Submission--一个study的数据,可以分多次递交至SRA数据库。比如在一个项目启动前期,就可以把study,experiment的数据递交上去,随着项目的进展,逐批递交run数据。LSBI采用了“项目”和“批次”的数据递交管理单位,study等同于项目,submission等同于批次的概念。
2. 数据库查询与结果展示
左侧菜单栏中,点击Run、Sample、Experiment、Study可以进行相关内容的高级检索。SRA数据库的高级检索可以最多使用三个限定词来进行更精确的检索,三个限定词之间可以用“AND”和“OR”相连接,其中“AND”表示查询的结果中必须包含它所连接的两个关键词,“OR”表示查询的结果中至少包含它所连接的关键词中的一个。
2.1. Run数据搜索与结果展示
点击左侧菜单栏进入Run界面后,再点击下拉菜单,可以看到4种限定词,AC、INSTRUMENT MODEL、CENTER和EXPERIMENT CAC,即Run的AC编号、仪器型号、测序中心缩写和实验的AC编号。
选择CENTER,输入"BCM"查询后,可见如下界面,显示了Run的摘要信息,如AC 编号、测序中心、仪器型号和实验的AC编号。
单击SRR000289可以看到详细的测序信息,包括基本信息、互交区和测序结果图谱
测序结果图谱说明
1)碱基位置序号刻度,以10为单位显示
2)对应位置碱基测序质量打分的值,只显示被读出的碱基对应的数值
3)质量得分直方图,对应2)中所示碱基
4)谱值直方图,同样对应2)中所示碱基
5)分为上下两行。上行为被读出碱基,下行显示所有有信号碱基
2.2. Sample数据搜索与结果展示
点击左侧菜单栏进入Sample界面后,再点击下拉菜单,可以看到2种限定词,AC和TAXON ID,即Sample的AC编号和分类编号。
选择AC,输入" SRS000249"查询后,可以看到Sample的摘要信息,如AC编号、通用名、分类编号号。
单击SRS000249可以看到详细的样本信息
truncate多张表加逗号吗
2.3. Experiment数据搜索与结果展示
点击左侧菜单栏进入Experiment界面后,再点击下拉菜单,可以看到4种限定词,AC、DESIGN DESCRIPTION、STUDY CAC和SAMPLE CAC,即Experiment的AC编号、实验设计、Study的AC编号和Sample的AC编号。
选择AC,输入"SRX000072"查询后,可见如下界面,显示了Experiment的摘要信息,如AC编号、实验设计、Study的AC编号和Sample的AC编号。
单击SRX000072可以看到详细的实验信息
Processing图标框中从左至右依次为打分类型、打分器、分级数量和放大倍数

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。