中国国家罕见病注册系统架构和数据
质量控制及管理流程
郭健①②③  吕浩涵①  李杰①  于伟超①  刘鹏①③  顾卫红*  张抒扬*
【摘要】中国国家罕见病注册系统(National Rare Diseases Registry System of China, NRDRS)是依托“十三五”国家重点研发计划精准医学专项“罕见病临床队列研究”项目,由北京协和医院负责牵头建设的国家级罕见病在线注册平台(),为中国罕见病事业的基础建设。罕见病病种繁多,注册数据来自真实世界复杂多样的临床场景,信息采集周期长,以存量数据为主,建立数据标准化规范难度很大。NRDRS平台管理组从三个方面逐步提升平台功能,加强数据质量控制:优化注册系统底层框架及管理功能;从多个环节加强数据质量控制并推进数据标准化;建立平台管理规范流程。迄今已有28个省、直辖市和自治区的85家协作单位的研究者基于NRDRS平台注册病例,涉及166种/类罕见病,已建立185个临床研究队列,登记病例共计6万余例。NRDRS平台的建立与发展不仅促进了中国罕见病研究协作网络和罕见病临床队列研究技术标准与管理规范的建立,同时为大型多中心、多病种临床研究的开展奠定了良好的基础。
【关键词】罕见病队列研究注册平台数据库
Doi:10.3969/j.issn.1673-7571.2021.01.004
【中图分类号】 R319        【文献标识码】 A
National Rare Diseases Registry System of China: Optimizing System Architecture and Enhancing Data Quality / GUO Jian, LYU Hao-han, LI Jie, et al.
Abstract: National Rare Diseases Registry System of China (NRDRS), led by Peking Union Medical College Hospital (PUMCH), is a national rare diseases registry, part of the nation's rare diseases infrastructure, funded under the government's "13th Five-Year Plan" Key Research & Development Projects - Precision Medicine Initiative, "Rare Diseases Cohort Study". NRDRS is an online rare diseases registry platform (), containing mostly existing case data entered by the researchers from nation's 85 collaborating hospitals in 28 provinces/ municipalities/autonomous regions, covering 166 rare diseases, and forming 185 clinical cohorts. These case data are versatile and complex, captured longitudinally from the real-world clinical setting, making data standardization extremely challenging. The NRDRS project team has focused on optimizing system's architecture and administration; strengthening data quality control and promoting data standardization; and establishing standard operation procedures on system management. The result is a much more robust and user-friendly rare diseases registration system with high quality of data, laying a solid foundation for multi-center collaborations and clinical research on rare diseases and 基金项目:国家
重点研发计划资助项目(编号:2016YFC0901500)
*通信作者:
张抒扬:中国国家罕见病注册系统(NRDRS)平台管理组,中国医学科学院北京协和医院心内科,100730,北京市东城区帅府园1号,E-mail:
顾卫红:中国国家罕见病注册系统(NRDRS)平台管理组,100730,北京市东城区帅府园1号,E-mail:
①中国国家罕见病注册系统(NRDRS)平台管理组,100730,北京市东城区帅府园1号
②中国医学科学院北京协和医院心内科,100730,北京市东城区帅府园1号
③中国医学科学院北京协和医院医学科学研究中心,100730,北京市东城区帅府园1号
orphan drugs.
Keywords: rare diseases, cohort study, registry platform, database
Fund project: The National Key Research and Development Program of China (No. 2016YFC090150
0) Corresponding authors:
ZHANG Shu-yang: The Administrative Group of National Rare Diseases Registry System of China, Department of Cardiology, Peking Union Medical College Hospital, Chinese Academy of Medical Sciences & Peking Union Medical College, Beijing 100005, P.R.C. E-mail:
GU Wei-hong: The Administrative Group of National Rare Diseases Registry System of China, Beijing 100005, P.R.C. E-mail:
罕见病是发病率和患病率很低,但是严重危害人类健康的一大组疾病的统称[1]。国际知名学术期刊Nature reviews 2020年发表述评,通过整合多个罕见病相关知识库和数据库,评估罕见病种类已超过10 000种[2]。中国人口基数大,保守估计约有2 000万以上罕见病患者,疾病负担十分沉重。为加强我国罕见病管理,提高罕见病诊疗水平,在广泛征集国内罕见病医学专家和各方意见的基础上,国家卫生健康委员会等5部门于2018年5月联合发布《中国第一批罕见病目录》,包括121种/类罕见病。
与欧美等发达国家相比,中国对罕见病的研究起步较晚,整体研究水平较低。虽然近年来相关临床研究和人研究逐渐增多,但多为单中心或区域性研究,存在较大局限性:研究规模和覆盖病种和人范围有限;各研究采集数据的类型和标准不统一,缺乏规范质量控制策略,难以共享融合;罕见病患者异地就医特点明显,单中心或区域性研究难以对患者进行长期随访。
中国国家罕见病注册系统(National Rare Diseases Registry System of China,NRDRS)是依
托“十三五”国家重点研发计划精
准医学专项“罕见病临床队列研
究”项目,由北京协和医院负责建
设的国家级罕见病在线注册平台,
为中国罕见病临床与相关科研的重
要基础建设,旨在确立统一的罕见
病注册标准和规范,联合全国罕见
病临床研究的优势单位,形成罕见
病研究协作网络,在全国范围内开
展患病率相对较高、疾病危害较大
的罕见病注册研究,推动我国罕见
病临床诊疗能力提升[3-4]。NRDRS
工作涉及众多专业和环节,需要
明确专业和责任边界,建立有序
连接的协作模式。经过近5年的建
设,NRDRS平台已初具规模,截
至2020年12月15日,来自全国28个
省、直辖市和自治区的85家协作单
位的研究者基于NRDRS平台注册
病例,涉及166种/类罕见病,已建
立185个临床研究队列,登记病例
60 696例,其中13 617例注册了生
物样本信息,16 114例注册了生存
状态和/或随访信息。
本研究将对NRDRS平台的系
统架构、数据质控策略和管理流程
进行详细介绍。
1 罕见病临床数据整体特点
罕见病大多为疑难病,病种繁
多,且疾病分类交叉重叠,临床
诊疗和基础研究处于不同阶段。
罕见病涉及所有的临床科室,疾
病表型各异,同一种疾病可能存
在临床变异,很多疾病累及多个
系统。中国罕见病专科医疗资源
分布极不均衡,大多数罕见病患
者需要异地就医,相当一部分患
者辗转多地就医,难以对患者进
行持续跟踪随访。注册病例数据
来自真实世界临床场景,由专业
医生/团队对原始临床资料(住院
病历和/或门诊病历)进行整理再
注册到平台,信息采集周期长,
路径复杂多样,大多为专业医生
及团队长期积累的存量数据和逐
步采集的增量数据,难以建立统
一的采集标准,规范化表单设计
需要逐步实现。
基于以上特征,N R D R S平
台从以下几个方面提升系统功
能,加强数据质量控制:优化注
册系统底层框架及管理功能;从
多个环节加强数据质量控制并推
进数据标准化;建立平台管理规
范流程。
数据库的连接。
3.3 疾病表单设计
3.3.1 规定信息采集表单逻辑结构 NRDRS平台是临床队列研究平台,信息采集表单的逻辑以研究为导向,研究者在临床诊疗过程中采集数据之后,需要进行整理再录入系统。平台管理组要求研究者在整理过程中即对发生缺失或错误的数据进行填补或修正。
3.3.2 规定信息采集表单的必填项目及其比例鉴于罕见病诊疗信息采集的长期性和病例构成的多样性(既往病例和新增病例),管理组将疾病表单的内容分为“必填项目”和“非必填项目”两部分。“必填项目”是指研究者在录入一个病例时必须要完整填写的内容,包括两个级别:①系统框架表单“基础信息”中必填项完整填写之后,方可打开疾病基线信息表单注册信息;②设置病例注册状态:疾病基线信息表单中必填项完整填写之后为“已注册”;反之为“待完成”,不计入队列注册病例数。“非必填项目”为必填项目以外的内容,允许研究者在病例注册之后逐步完善。
3.3.3 规定采集数据类型和数据格式研究者基于具体疾病队列数据需求设计表单,根据信息类型归入统一的分类:①基本信息;②病史;③查体;④辅助检查;⑤干预;⑥评估量表;⑦混合(同时属于上述2个及以上分类标签的信息);⑧其他(不属于以上分类标签的信息)。
管理组对不同表单中同类数据的采集进行统一规定,如计量单位
要一致,图像数据除上传原始结果
外,还需进行必要的注释。
3.4 数据清洗和整理研究者将病例
数据采集后,通过终端设备上传至
NRDRS数据库。平台管理组在充
分尊重原始数据内容和形式的基础
上,对上传的数据进行清洗和整
理。数据清洗和整理工作包括:①
核查数据采集工作的规范性;②核
查采集数据的完整性;③核实采集
数据的准确性;④核查采集数据的
逻辑准确性;⑤保证录入病例的唯
一性。对存在错误或存疑的条目,
将与研究者核实确认后进行修正。
平台管理组定期对已采集数据的质
量进行评估,并基于前期工作、医
学和数据专业的发展不断优化数据
质量控制流程。
4 平台管理流程
平台管理组逐步建立了用户、
表单和组三套管理流程,从各个
环节提高科学性和规范性,进而提
升平台管理效率,建立可持续发展
的专业管理模式。
4.1 用户管理
4.1.1 新增用户流程 NRDRS平台
对新增用户实行“推荐-审核制”
(图3A),即由平台已注册的研
究者推荐同一专业领域内有资质的
研究者,被推荐者需向平台管理组
提交相关申请材料,包括个人信
北京疫情最新数据息、拟参与/建立注册队列、相关
工作基础和已有成果。
4.1.2 已注册用户管理流程用户信
息定期更新:用户登录时需完整
录入/确认用户信息(基本信息、
职称、工作单位、医师资格证书编
号、执业资格证书编号、联系方
式、个人简介和团队工作基础),
方可进行后续操作。当研究者个人
信息发生变动时,应及时更新已录
入的信息。
4.1.3 用户层级和权限管理 NRDRS
平台设置“研究者”和“研究助
手”两级用户。研究者用户可启动
新病种的队列研究,加入已开展的
队列研究,建立研究组,或以组员
身份加入研究组;研究助手用户由
研究者用户设立,只能在研究者用户
的管理下开展工作(图3B)。
4.2 表单管理
4.2.1 新建表单平台管理组规定只
有研究者用户可以新建疾病表单,
新表单建立采用“申请-审核制”
(图3C)。申请者需向管理组提
供以下信息用于审核:①属于罕见
病范畴的拟研究的疾病名称,相关
知识库(OMIM编码或Orphanet编
码)或者文献依据;②疾病简介;
③研究工作基础;④相关研究成
果;⑤如NRDRS已有该种/类疾病
表单,申请者希望新建表单,需要
阐明原因。新表单的设计需严格遵
守平台建立的表单设计规则,管理
组将提供必要的医学专业支持和统
计学支持。
4.2.2 修改表单罕见病相关知识处
于不断积累的阶段,NRDRS允许
设计者在研究过程中对表单进行调
整。设计者需提交表单修改申请,
管理组将对调整内容的可行性和合
理性进行评估,确保不会影响已录
入数据(图3D)。
4.2.3 疾病基线信息表单升级为了

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。