组学原始数据归档库(GSA)使用说明
系统简介 (2)
用户注册 (2)
GSA数据集创建 (3)
connect下载GSA数据集修改、删除和追加 (12)
GSA数据集发布 (14)
GSA数据集分享链接生成 (15)
数据文件上传 (16)
Aspera命令行上传(推荐) (16)
FTP上传 (18)
协助上传 (25)
数据触发机制说明 (26)
提交状态与操作说明 (27)
系统简介
组学原始数据归档库(Genome Sequence Archive, GSA)是组学原始数据汇交、存储、管理与共享系统。GSA遵循INSDC数据库系统的数据标准和数据结构,主要汇交实验信息(Experiment Metadata)、测序反应信息(Run Metadata)信息以及归档测序文件数据(Sequence Data file)。GSA用户可通过大数据中心生物数据统一汇交入口——生物数据递交系统(BIG Submission,BIG Sub)完成一站式数据递交。
用户注册
请您进入生物数据递交系统(BIG Submission,BIG Sub,bigd.big.ac/gsub/)完成账号注册,建议使用实验室公共邮箱进行注册。如果您在账号注册和使用过程中遇到任何问题,请联系*****************。
GSA数据集创建
为保证元数据信息与测序数据文件的一致性与完整性,便于后续数据使用者检索与使用,通过BIG Sub统一入口递交GSA数据信息时,用户需要为GSA数据集的研究任务创建BioProject,并为数据集的实验样本创建相应的BioSample(s)。GSA各类数据信息间是线性的、一对多的关联关系,数据结构如下图。
本系统支持中英文双语言模式,可随时自由切换
⚫提交者信息(Submitter)—用于收集数据提交者信息,系统会帮您自动填入用户注册时的姓名和信息,如部分信息需要调整,可直接修改并通过“保存并进入下一项
(Save and forward)”键完成修改。
注:数据信息审核与文件归档过程中出现任何问题,信息将反馈到您的注册邮箱,
而非此处填入的提交者信息邮箱。
⚫基本信息(General)—用于收集GSA数据集的描述信息,包括发布日期(Release date)、标题和描述信息(Description)、项目信息(BioProject accession)、样本信息
(Sample Information)。
注:如果您已创建好GSA相关的BioSample,请选择“已经创建GSA相关的
BioSample信息”,根据系统提示依次完成下文中“元数据信息”和“文件上传”步骤,最终
检查无误后完成提交。
如果您还未创建GSA相关的BioSample,请选择“未创建GSA相关的BioSample 信息”,依照以下流程完成提交:
Release Date的设置时间,用户可根据项目
需求进行设定,但最长不要超过2年。
发布策略和免责声明
如果您已经创建了BioProject,请选出对应Accession号;
如果您还未创建BioProject,请点击并前往创建BioProject;
此处以未创建GSA相关的BioSample信息为例
⚫样本类型(Sample Type)—用于收集有关样本类型信息。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论