人类短串联重复序列(STR)的研究进展
短串联重复序列( Short tandem repeat ,STR)又称 微卫星DNA, STR 是一种可遗传的不稳定的并且具有高度多态性的短的核苷酸重复序列. STR 多态性具有种类多,分布广,高度多态性等特点,并按孟德尔遗传规律[ 1 ]在人中世代相传. 通过对STR 多态性的认识,极大地推动了人类基因组的研究. 这种多态性标志已广泛用于构建人类遗传连锁图谱、基因定位、遗传病诊断、肿瘤细胞染体分离与重组以及亲子鉴定等法医学检查.
DNA遗传标记的多态性研究发展按时间顺序可分为三代[4 ]。第1代遗传标记:限制性片段长度多态性( restriction fragment length polymorphism, RFLP)是Wyman 和White 于1980年偶然发现的,人类14号染体上存在DNA片段长度有变化的区域,这些区域的结构特点是DNA由一段序列串联重复、首尾相接而成。重复次数可在几次至数百上千次之间变化。DNA重复单位长度在数bp至数十bp之间,组成串联重复的DNA是小卫星DNA。第2代遗传标记:短串联重复序列是由Holly等发现的重复单位的长度只有2~6 bp、重复次数一般在数次至几十次之间的串联重复DNA序列,即微卫星DNA。微卫星DNA的等位基因片段的长度一般在400 bp以下,故又称为短串联重复序列( STR)。第3代遗传标记:单核甘酸多态性( single nucleotide polymorphism, SNP)
是单个碱基的置换、插入或缺失而形成的,是美国MIT提出的新一代多态性标记系统[5],近年来成为多种研究的焦点。虽然SNP的多态性位点是最多的,能比STR提供更全面的基因信息,但是STR还是以其独特的优点保存下来,仍被广泛的研究。
1.1 STR 的构成 STR 的核心序列为2~7bp ,呈串联重复排列.重复次数10~60 次左右,其总长度常小于400 bp.常见的有一、二、三、四核苷酸重复序列,约占真核生物基因组的5 %. 人类基因组的STR 单核苷酸重复以polyA ,polyT 多见,双核苷酸重复以(CA) n ,( GT) n , (AA) n , ( GG) n 常见, ( GC/ CG) 少见,其原因是由于3′端为G的C(即CPG) 易于甲基化. 三核苷酸重复以(CXG) n 类型常见,由于三核苷酸具有高度多态性,常用作DNA 的标记物.
每个特定位点的STR 均由两部分构成:中间的核心区和外围的侧翼区. 核心区含有一个以上称为“重复”的短序列,一般该重复单位的碱基对数目不变,而串联在一起的重复单位数目是随机改变的,如果用一种不切重复单位的限制性内切酶把DNA 分子切割成限制性片段,该限制性片段中位于核心区的外围即是侧翼区. 人中不同个体可表现为侧翼区相同而串联重复单位的数目不同;也可为相同数目的重复单位,但侧翼区大小不同,或者两者均不同. 通过对那些非STR 位点的DNA 限制性片段长度多态性( Rest riction f ragment lengthpolymorphism ,RFL P) 研
究表明,每个位点的RFL P仅能检测到1 个或数个等位基因. 因此可以推论,STR 位点的侧翼区变异数也仅有少数几个. 这样,人中该特定STR 位点的等位基因差异,主要应来自不同数目的串联重复[2,3]。
1.2 STR的分布 据GeneBank等数据库资料统计,人类23 对染体上至少分布着7901个STR位点,每对染体的STR位点分别超过100个,其中1、2号染体的位点均超过600个,性染体上的已知位点数在264 个以上,现有的STR 位点覆盖长度达4000cM,平均间距0. 7 cM。随着人们对STR的进一步研究,其数目还会不断增加。
1.3 STR的种属特异性 与多种基因座的指纹图不同,大多数STR具有人的种属特异性,至少是具有灵长类的种属特异性。1995年有学者[ 6 ]调查了9个STR的人种属特异性,结果在被调查的23种动物中, FES/FPS基因座没有扩增产物,而CSF1PO、TOX、TH01、HPRTB、vWA、F13A01等基因座则在灵长类有扩增产物,但是这些扩增产物的长度均位于这些基因座的STR的等位基因Ladder范围之外。此后对更多STR基因座的调查也得到了相似的结论。
1.4 STR产生的可能机制 目前认为链滑动错配是短串联重复序列突变的主要机制。在DNA合成过程中,一条单链DNA可以发生一过性的脱位,生成一个中间性的结构后,再与另一DNA单链
错配,形成链滑动错配,继续DNA的复制和修复。滑动错配可以造成缺失、插入或碱基替换。在STR中,一条DNA单链可以向后折叠后再与另一条单链复性,在复性的位置形成环状突出,DNA修复酶可以将环状突出全部或部分切除,造成缺失。另一方面,也可以在无突出链相对突出的位置形成一个缺口,再由聚合酶填补此缺口,DNA重复的数目增加,造成插入突变。STR长度上的差异一般是重复单位的整数。复制滑动、妹染体不等交换和遗传重组都是可导致重复单位数目发生改变的机制,但目前的研究证明复制滑动时导致STR重复数目改变是主要机制。链滑动错配还可以发生在一段单链的DNA片段,多见于回文序列或回文样序列。如CTGCAG和GCCNNNNNGGC。回文序列自身互补形成发夹结构,也能造成缺失或插入。不过,仅滑动链复制错配不能解释一些重复序列的特征,如为什么两性种系的三体重复稳定性有差异? 为什么CAG重复总在有意义链上等等? 所以,对STR产生和拷贝数的变异的遗传机制解释还有滚环扩增、不等交换( unequalcrossover)和碱基置换突变
等。
2 基于STR的应用研究
单个基因座的STR的遗传信息是很有限的,复合扩增可以增加遗传多态性信息,提高工作效率。
在复合扩增中,多对引物在同一反应管中进行。引物之间的互相作用,可导致非特异性的扩增产物出现,影响STR的分型。经大量的研究证明,只要复合扩增的条件是适当的,在绝大多数的情况下,复合扩增从双基因座扩增、三基因座扩增、四基因座扩增、七基因座扩增,直至15个STR基因座和一个性别基因同时复合扩增,检测方法从银染方法到用荧光标记引物在自动测序仪中自动分型,单基因座扩增与复合扩增的STR分型具有相同的结果。
基因多态性目前STRs- PCR 技术已形成多位点检测方法, 即在同一分析反应中同时扩增来自两个或更多的位点的等位基因,扩增的重复序列由于重复次数的差异导致STR 基因座的等位基因分型不同, 在电泳分离后, 用放射性同位素、银染或荧光检测可区别不同的基因型。STRs- PCR 产物具有不连续的可分离的长度, 可以用每个基因座的几个或所有等位基因的片段构建成等位基因阶梯( allelic ladder) , 肉眼观察或利用仪器比对同一基因座的等位基因阶梯和扩增样品, 从而快速和准确地确定等位基因座。
2.1 STR应用于制作人类基因组遗传图谱 遗传图谱( geneticmap)是指人类基因组内基因和专一的多态性DNA标记相对位置的图谱。STR在基因组内分布广泛、多态性程度高、可自动化检测、成为制作基因组遗传图谱的首选遗传标记。STR作为遗传标记使人类基因组的遗传制
图和连锁分析发生了革命性的变化。1996年,法国Gene-thon实验室与美国国家卫生研究院几个中心合作,建立了以6000多个STR为主体遗传标记、分辨率达194 kb的高精密度图谱[ 7 ]。STR的出现使遗传图的精度得到进一步提高,同时也成为物理图上的标记,从而促进了遗传图与物理图的融合。利用STR作为遗传标记,人类基因组计划中的物理图于2000年也顺利完成[ 8 ]。
2.2 STR用于法医学个体识别和亲权鉴定 法医检案中,经常会遇到极少量和较大降解的生物检材,最好的方法是用PCR扩增STR。人体血液、精液、精斑、毛发、指甲、骨和牙齿均可作为分析STR 的DNA 来源[ 9 ]。正是因为STR广泛存在于人类基因组中,具有高度多态性、杂合性和稳定性。当把几个STR位点联合分析后,可以得到相当高的累积个体识别率和父权排除率。据统计,两个无亲缘关系的个体基因型完全一致的概率< 10 - 12 ,因而STR用于法医学领域有着广阔的前景。国内学者对粤、桂、琼地区14个人STR基因座频率调查显示15个STR基因座在14个人中累积个体识别能力在1.05 ×10 - 16 ~3. 18 ×10 - 18 ,累积非父排除率均在0. 9999[ 10 ]以上。泰国学者对泰国人的15个STR位电的分析得出累积个体识别能力为7. 01×10 - 18 ,累积非父排除率为0. 999999545[ 11 ] 。从这些数据充分显示, STR在法医学个体识别和亲权鉴定中,为司法审判、侦案、破案提供有利的科学依据[ 12 ]。。在由国际刑警
组织注册的对性侵犯定罪的立法提案程序中, 所有参与的实验室都必须检测4 个重要位点, 即: THO1、VWA、FGA 和D21S11, 他们的个体识别能力强而有效, 已成为欧洲众所周知的核心位点, 1999年后又扩展了另外的3 个位点。最近在北美已经引入以STRs为基础的DNA 索引数据库, 建立了13 个STRs 位点的复合扩增: THO1、VWA、FGA、TPOX、CSF1PO、D3S1358、D5S181、D3S820、D8S1179、D13S317、D16S539、D18S51 和D21S11。
2.3 STR用于遗传学多态性研究
STR标记多位于非编码区,变异一般不影响人体的结构与功能,突变在进化过程中受自然选择压力较小,以近乎稳定的速率传递且不断积累,形成多样性。通过研究STR多态性,变异速率以及比较序列间差异、人间差异,分析不同人间的遗传距离,就可从分子生物学角度揭示人类的起源、迁徙、进化等历史进程[ 13 ]。目前,根据mtDNA、STR标记、Y染体DNA以及多态性Alu I序列的研究,大多数分子遗传学家支持现代人类单起源学说,认为现代人类起源于20万年前的非洲原始部落,然后向世界各地迁徙。但也有学者支持现代人类多起源,认为除非洲外,亚洲、欧洲也可能是人类发源地。Karafet[ 14 ]等通过Y - DNA创立者单体型的分析揭示存在1个以上的父系创立者单体型,美洲土著具有亚洲起源。
2.4 STR在疾病诊断和中的应用 DNA多态遗传标记的建立为基因染体定位奠定了基础,家系连锁分析是目前最常用的基因定位方法。目前连锁分析定位基因所用的遗传标记主要是STR。STR等位基因数目较多,可提供的信息量大,因而在进行连锁分析时所需的样品数比采用双等位基因标记( SNP)时要少,适用于致病基因的初步定位[ 15 ]。
2.4.1 STR与遗传病的诊断 近年来,发现基因内外的一些STR 与遗传病的发病有关. 目前报道较多的疾病有7 种遗传病与三核苷酸重复片段扩增突变有关:脆性X 综合征、脊髓延髓肌肉萎缩、强直性肌营养不良、Huntington舞蹈征、脊髓小脑共济失调Ⅰ型、FRAXE 轻度智力低下和齿状核苍白球丘脑下部萎缩. 在脆性X 综合征中,FMR1gene 中的(CGG) 顺序在正常人中的重复次数少于60 次,携带者60~100 次,而发病者则多于100 次. 也有人用STR 来研究单基因病,如苯丙酮尿症等[ 15 ]. 现在,STR 越来越多用于研究多基因病,如采用STR 对Ⅰ型糖尿病进行全基因组扫描,发现12 个位点与该疾病高度相关,其中包括HLA22 抗原位点. 更多的人开始用STR 方法对高血压、哮喘和Ⅱ型糖尿病进行了研究。
2.4.2 STR与肿瘤的诊断 微卫星DNA 由于复制错误引起简单重复序列改变, 常产生微卫星不稳定性( Microsatelliteinstability ,MSI) ,表现为肿瘤组织与其相应非肿瘤组织DNA 结构性等位
基因的大小发生改变. 它在胃肠道肿瘤的发生、发展过程中扮演重要角,可能是肿瘤发生的一种新机制. MSI 首先在结直肠癌中观察到,1993 年,有的学者在研究遗传性非息肉大肠癌中观察到多条染体均有短的核苷酸重复序列(CA) n 的增加或丢失,提示MSI 散布于整个基因组中. 后来陆续在子宫内膜癌、肺癌、乳腺癌、食管癌以及慢性髓细胞性白血病中都出现MSI ,人们认为MSI 可能在肿瘤基因调控中起重要作用,参与肿瘤的发生和发展. 这种基因水平的改变常先于表型的改变,通过MSI 的检测有助于早期发现某些肿瘤及对高危人进行早期防治.
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论