(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201710108853.0
(22)申请日 2017.02.27
(71)申请人 武汉大学
地址 430072 湖北省武汉市武昌区珞珈山
武汉大学
申请人 武汉珈创生物技术股份有限公司
(72)发明人 沈超 朱欢 刘晏瑞 刘月红
袁冰 徐国东 郑从义
(74)专利代理机构 武汉科皓知识产权代理事务
所(特殊普通合伙) 42222
代理人 鲁力
(51)Int.Cl.
C40B 50/06(2006.01)
G06F 19/22(2011.01)
G06F 17/30(2006.01)
(54)发明名称
用于细胞系鉴定的21位点STR数据库的建立
方法及细胞鉴定及匹配率的计算方法和系统
(57)摘要
本发明涉及用于细胞系鉴定的21位点STR数
据库的建立方法及细胞鉴定及匹配率的计算方
法和系统,通过检测得到多个细胞系的21个位点
数据;建立数据表,以获得所述21位点STR数据
库,数据表包含21组STR位点数据记录,一组记录
字符串长度比较对应一个STR位点,每组记录包含至多三条STR位
点记录。在21位点STR数据库的基础上,本发明提
供了三种鉴定未知细胞的方法:CCTCC、ATCC、
DSMZ数据库匹配率计算。此外,本发明还提供了
一种计算两株未知细胞亲缘性的方法。本发明数
据库的另一优点在于,可以根据待测细胞任选
的,至少9个至多21个STR位点的来计算其与数据
库中已知细胞系间的匹配率,从而来鉴定其细胞
系种类。权利要求书2页 说明书7页 附图9页CN 106894095 A 2017.06.27
C N 106894095
A
1.一种用于细胞系鉴定的21位点STR数据库的建立方法,其特征在于,21个STR位点包括ATCC与DSMZ中的9个位点,以及D19S433、D21S11、D18S51、D6S1043、D3S1358、Penta D、D2S441、D8S1179、Penta E、D12S391、D2S1338、FGA的12个位点,具体包括:步骤1,通过检测得到多个细胞系的21个位点数据;
步骤2,建立数据表,以获得所述21位点STR数据库,所述数据表包含21组STR位点数据记录,一组记录对应一个STR位点,每组记录包含至少两条STR位点记录;所述数据表包含多个字段,所述字段包含:
字段一:STR位点名称,
字段二:STR位点特征数
字段三:是/否能为空。
2.根据权利要求1所述的一种用于细胞系鉴定的21位点STR数据库的建立方法,其特征在于,所述步骤2中,每组记录中,AMEL性别位点包含两条记录,其他位点均包含至少一条至多三条不同的记录。
3.一种采用权利要求1所述的21位点STR数据库的细胞鉴定的方法,其特征在于,根据21位点STR数据库中计算与已知细胞系的STR特征数的匹配率,以实现所述鉴定,具体计算包括:
计算方式一:STR数据库匹配率(%)=送检样品细胞与数据库比对细胞等位基因中相同等位基因的总数目/(样品细胞等位基因总数目+数据库比对细胞等位基因总数目)* 100%
计算方式二:ATCC数据库匹配率(%)=(送检样品细胞与数据库比对细胞共有等位基因数目/数据库比对细胞等位基因总数目)*100%
计算方式三:DSMZ数据库匹配率(%)=送检样品细胞与数据库比对细胞共有等位基因数目*2/(送检样品细胞等位基因总数目+数据库比对细胞等位基因总数目)*100%。
4.根据权利要求3所述的采用21位点STR数据库的细胞鉴定的方法,其特征在于,21位点STR数据库计算方法中纯合等位基因只记一个;ATCC数据库计算方法中纯合等位基因只记一个;DSMZ数据库计算方法中纯合等位基因记两个。
5.权利要求4所述的采用21位点STR数据库的细胞鉴定的方法,其特征在于,其特征在于,根据计算方
式一、二、三中任意一种方法计算待测细胞中至少9个至多21个STR位点的匹配率。
6.一种采用权利要求4所述的细胞鉴定的方法计算两个细胞系间的STR匹配率,其特征在于,定义两个细胞系,分别是细胞系A和细胞系B,计算细胞系A和细胞系B间的STR匹配率采用计算方式一、二、三中任意一种方法计算两个细胞系间的STR匹配率;具体包括:计算方式一:STR数据库匹配率(%)=细胞系A与细胞系B等位基因中相同等位基因的总数目/(细胞系A等位基因总数目+细胞系B等位基因总数目)*100%
计算方式二:ATCC数据库匹配率(%)=(细胞系A与细胞系B共有等位基因数目/细胞系B等位基因总数目)*100%
计算方式三:DSMZ数据库匹配率(%)=细胞系A与细胞系B共有等位基因数目*2/(细胞系A等位基因总数目+细胞系B等位基因总数目)*100%。
7.一种细胞鉴定的系统,其特征在于,包括:
输入装置,用以输入所测细胞的STR特征数;
输出装置,用以输出所测细胞的细胞系匹配率;
21位点STR数据库存储装置:与输入装置和输出装置相连,用以根据数据库中细胞系数据和计算方式一、二、三匹配率计算方法进行匹配率的计算。
用于细胞系鉴定的21位点STR数据库的建立方法及细胞鉴定
及匹配率的计算方法和系统
技术领域
[0001]本发明属于生物学研究中细胞系鉴定的领域,具体的,本发明涉及构建细胞系21位点STR特征数的数据库的方法、21位点STR数据的数据库在细胞系鉴定中的用途、细胞系来源鉴定的方法及系统。
技术背景
[0002]近年来,对于细胞的研究成果斐然,有关细胞周期、细胞凋亡等研究成果也都获得了诺贝尔奖,而随着细胞应用的广泛,带来的问题也逐渐显现,细胞交叉污染、身份错误识别等问题十分严重,这对于生物学科研、临床医学研究、药物开发、疫苗生产等方面造成了重大的影响并且产生了巨大的经济损失。因此,排查细胞污染、鉴定细胞系身份,尽可能地减少错误细胞使用频率,对于提高科研效率、减少时间和经济的损失、具有重大意义。[0003]人源细胞作为一种重要的生物资源,已广泛地应用于生命科学、临床医学基础性研究及产品开发。但是,由于不规范操作等原因,人源细胞系的交叉污染现象日
趋严重。细胞的错误鉴定或交叉污染可能引起很多不良后果,如得出错误的检测数据、违反自然规律的研究结论、毫无价值的产品、甚至导致多年的研究成果付诸东流。从细胞培养技术诞生之日起,特别是多种细胞系同时持续培养,细胞交叉污染就更加难免。
[0004]STR(短串联重复序列)基因位点由长度为3~7个碱基对的短串联重复序列组成,这些重复序列广泛存在于人类基因组中,可作为高度多态性标记,被称为细胞的DNA指纹,其可通过一定的计算方法,即可根据所得的STR分型结果与专业的细胞STR数据库比对从而推算出样品所属的细胞系或可能的交叉污染的细胞系名称。目前ATCC和DSMZ都采用了D5S818、D13S317、D7S820、D16S539、VWA、TH01、AMEL(性别位点)、TPOX、CSF1PO九个STR位点进行对比分析鉴定细胞系。
发明内容
[0005]本发明的上述技术问题主要是通过下述技术方案得以解决的:
[0006]一种用于细胞系鉴定的21位点STR数据库的建立方法,其特征在于,21个STR位点包括ATCC与DSMZ中的9个位点,以及D19S433、D21S11、D18S51、D6S1043、D3S1358、Penta D、D2S441、D8S1179、Penta E、D12S391、D2S1338、FGA的12个位点,具体包括:
[0007]步骤1,通过检测得到若干个细胞系的21个位点数据;若干个是指有100多株数据,可以不断增加
[0008]步骤2,建立数据表,以获得所述21位点STR数据库,所述数据表包含21组STR位点数据记录,一组记录对应一个STR位点,每组记录包含至少两条STR位点记录;所述数据表包含多个字段,所述字段包含:
[0009]字段一:STR位点名称,
[0010]字段二:STR位点特征数
[0011]字段三:是/否能为空。
[0012]在上述的一种用于细胞系鉴定的21位点STR数据库的建立方法,其特征在于,所述步骤2中,每组记录中,AMEL性别位点包含两条记录,其他位点均包含三条记录。其中AMEL性别位点,就是X染体和Y染体,两条记录就是X,X;或者X,Y;不可能会有三条记录的情况出现。
[0013]采用21位点STR数据库的细胞鉴定的方法,其特征在于,根据21位点STR数据库中计算与已知细胞系的STR特征数的匹配率,以实现所述鉴定,具体计算包括:
[0014]计算方式一:STR数据库匹配率(%)=送检样品细胞与数据库比对细胞等位基因中相同等位基因的总数目/(样品细胞等位基因总数目+数据库比对细胞等位基因总数目)* 100%
[0015]计算方式二:ATCC数据库匹配率(%)=(送检样品细胞与数据库比对细胞共有等位基因数目/数据库比对细胞等位基因总数目)*100%
[0016]计算方式三:DSMZ数据库匹配率(%)=送检样品细胞与数据库比对细胞共有等位基因数目*2/(送检样品细胞等位基因总数目+数据库比对细胞等位基因总数目)*100%。[0017]在上述的采用21位点STR数据库的细胞鉴定的方法,21位点STR数据库计算方法中纯合等位基因只记一个;ATCC数据库计算方法中纯合等位基因只记一个;DSMZ数据库计算方法中纯合等位基因记两个。
[0018]在上述的采用21位点STR数据库的细胞鉴定的方法,根据计算方式一、二、三中任意一种方法计算待测细胞中至少9个至多21个STR位点的匹配率。
[0019]一种采用细胞鉴定的方法计算两个细胞系间的STR匹配率,其特征在于,定义两个细胞系,分别是细胞系A和细胞系B,计算细胞系A和细胞系B间的STR匹配率采用计算方式一、二、三中任意一种方法计算两个细胞系间的STR匹配率;具体包括:
[0020]计算方式一:STR数据库匹配率(%)=A细胞与B细胞等位基因中相同等位基因的总数目/(A细胞等位基因总数目+B细胞等位基因总数目)*100%
[0021]计算方式二:ATCC数据库匹配率(%)=(A细胞与B细胞共有等位基因数目/B细胞等位基因总数目)*100%
[0022]计算方式三:DSMZ数据库匹配率(%)=A细胞与B细胞共有等位基因数目*2/(A细胞等位基因总数目+B细胞等位基因总数目)*100%。
[0023]一种细胞鉴定的系统,其特征在于,包括:
[0024]输入装置,用以输入所测细胞的STR特征数;
[0025]输出装置,用以输出所测细胞的细胞系匹配率;
[0026]21位点STR数据库存储装置:与输入装置和输出装置相连,用以根据数据库中细胞系数据和计算方式一、二、三匹配率计算方法进行匹配率的计算。
[0027]因此,本发明具有如下优点:1、本发明数据库可以根据不同的需要选择不同的算法来鉴定细胞,也可以三种计算方法均使用来鉴定同一细胞系来增强鉴定结果的准确性。此外,本发明还提供了一种计算两株未知细胞亲缘性的方法,即可输入两株细胞的STR特征数,任选以上三种算法之一,便可得到这两株细胞STR的匹配率,从而预测两株细胞间的亲缘关系。2、在使用三种计算方法计算匹配率时,可以根据待测细胞任选的,至少9个至多21个STR位点的来计算其与数据库中已知细胞系间的匹配率,从而来鉴定其细胞系种类。同
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论