国外药物研发数据共享案例及经验借鉴
随着科学研究进入数据密集型范式,科学大数据不仅仅是科学研究的结果,也成为科学研究活动的基础和起点。
为促进临床数据共享,WHO临床试验注册平台于2015年8月发布了关于支持临床试验数据共享的声明,国际医学期刊编辑委员会于2016 年1月20日发布了关于临床试验数据共享的建议。中国临床试验注册中心亦决定从2016年3月14日起,要求公开原始数据(包括原始记录数据和研究计划书)共享计划、数据保存和管理规划、在知情同意书中加入公开原始数据内容,旨在进一步推动临床试验透明化,履行医学研究者的社会责任。
新药研发具有复杂程度高、周期长、投入高、成功率低等特点,平均每5 000~10 000 个化学或生物分子中可筛选出250个先导化合物进入临床前研究阶段,最终仅有1个能获批上市。1种新药从发现到成功上市通常需要10~15 年[3],平均投资13.95亿美元[4]
开放源代码意味着什么研发过程中,从药物发现到新药申请,从临床前试验到上市后的临床效果评价,无不建立在翔实而可靠的科学数据基础上。有效的数据挖掘和模型开发需要有代表性的、经过处理的大数据集,
但是以往按照严格的临床试验指南产生的高质量临床前安全数据由于项目特点、知识产权保护或竞争优势保护等原因而不会公开,仅有少量上市药物的安全性数据有时会以概要的形式发布。因此获得并共享高质量、高赋值的新药研发数据存在较多障碍。而破解这一难题,是提高药物研发效率的关键。为此,本文介绍并分析了欧洲制药工业联合会支持的2个药理学、毒理学数据共享平台的解决方案,为我国新药研发数据共享平台建设提供参考。
1 我国的药物研发数据共享平台建设
我国对新药研发平台建设高度重视,“十一五”期间启动了“重大新药创制专项”,在全国范围内布局15 个“综合性新药研究开发技术大平台”,旨在全面提升我国的新药创制能力。如国家十一五“重大新药创制”科技重大专项——“ 精神药物新药临床评价研究技术平台”获得了2008-2020年的滚动支持。目前该平台建立了精神药物临床试验协作网,由具有较高精神疾病诊疗和科研水平的单位自愿联合组成学术团体,实现了电子化数据管理并获国际认可。但该平台不直接涉及任何一项具体临床试验的实施,只是一个纯粹的学术协作网络。
科技部于2003年将科学数据共享工程作为重大项目立项,2010年国家人口与健康科学数据共享平台面向社会开放提供服务,目前该平台已有20T的科学数据在线开放。
其中,由中国医学科学院药物研究所负责的药学科学数据中心,在国家科技基础条件平台项目的支持下,成为实质上的国家药物研发共享平台。
药学科学数据中心作为国家人口与健康科学数据共享平台的重要组成部分,目前提供数10个药学数据库的资源共享,包括药物靶点数据库、药用天然提取物活性库、中国天然产物化学成分库、虚拟化合物库、药物分析方法数据库、中药及天然产物质量控制库等数据库等药物研发类数据库,以及药物资源类数据库、药品使用类数据库、药事管理类数据库等,为开展“创新药物研究”专题服务奠定了基础。
为确保数据资源量,增强服务创新药物研发的能力,平台定期征集、整合数据实体,汇交到药学数据中心进行初筛、分类、标识,制作对应元数据并在平台门户网站共享。
国家人口与健康科学数据共享服务平台药学数据中心主页如图1所示。
国家人口与健康科学数据共享服务平台药学数据中心主页
其中,“新药研发动态数据库”“新药动态”信息定期发布。“新药研发动态数据库”整合国外多个著名新药研发数据库中的信息,包括Thomson Integrity、CORTELLIS、Pharmaproject等药物信息数据库,PubMED、Embase等文摘数据库,Elsevier Sciencedirect、Springer 等全文数据库,Thomson Innovation、Derwent Innovation Index等专利数据库;“新药动态”每月
发布国外特别是美国FDA新审批的新分子实体药物和生物制品药物信息,总结归纳药物的研发历程,系统梳理药物理化特性、合成路线、细胞试验信息、动物试验信息、Ⅰ期、Ⅱ期、Ⅲ期临床试验信息、审批上市信息,使国内科研人员能及时了解国外药物审批动态及研发历程。
可见,当前我国新药研发知识服务都是源于各种数据库中可直接利用的知识和信息,权威、可靠的药物研发初始数据尚无共享利用渠道,尚未提供知识识别和知识推理服务[10],距离新药研发数据多学科、多层次和多级别共享的目标还有很大差距。从实践结果看,近10年来各种基金资助的数据平台很多,但达到预期目的并投入使用的寥寥无几。
2 成功的药物研发数据共享项目eTOX
FDA 2000-2012年的回溯性综述报告显示,在药物研发的所有阶段,毒性相关的副作用一直是新的候选药物夭折、影响新药开发的主要原因,因此需要在药物研发的临床前阶段更早预测其安全性。各种预测模型的质量在不断改进,但预测的可靠性仍然有待提高,如心血管毒性很多要到大规模的Ⅲ期临床试验才能发现。分析、探究之前失败的原因有助于改进新药临床开发效率及其安全性。
2010年,在创新药物计划的驱动下 ,欧洲制药工业协会联合会(EFPIA)启动了eTOX项目,其全称是“用于计算机毒性预测专家系统开发的整合生物信息学和化学信息学方法 ”。由11所院校、6家中小企业和13个制药公司组成公-私联盟,共同建立了eTOXsys平台,包括数据库整合和全部预测模型,旨在实现知识共享,为候选新药的设计提供新的工具。其目标是从论文或PDF文档中提取和共享13家制药公司毒理学研究部门产生的临床前毒性研究数据,并利用这些数据建立一个翔实的数据库,作为药物研发参照数据源,即通过类似的结构和/或效果比较早期评估候选药物的潜在毒性,以及进行预测模型训练。目前平台提供13家制药公司的逾4 000项研究,对应1 400多个化合物。
eTOX数据库除包括药理学安全性、药代动力学、药效学、药物分布、生殖毒性和致癌性研究数据以及之前的各种毒物基因组学和毒理学项目外,还从文献和公开出版物中筛选可用于eTOX的数据、工具、方法或者讨论。这些经过筛选的数据存储于eTOXlibrary,对公众开放。其成功运行有以下几个原因。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。