功能性SNP的筛选方法及其在疾病易患性研究中的应用
汪玉洁1△(综述),白 云2,王升跃1,2※(审校)
【摘 要】摘要:单核苷酸多态性(SNP)是继微卫星后第三代DNA遗传标记。近年来已鉴别出大量疾病的易患基因与位点,然而由于传统统计学方法的不足,加大了假阳性结论产生的概率。为解决这一问题,研究者们应用质粒转染、电泳移动漂移实验以及染质免疫沉淀等技术从大量潜在的易患位点中鉴别出许多真正具有功能的SNP位点。现以结构基因中SNP所在位置进行分类,从影响基因表达以及改变蛋白质功能等方面出发,对各SNP功能研究方法进行总结。
【期刊名称】医学综述
【年(卷),期】2013(019)003
【总页数】4
【关键词】关键词:单核苷酸多态性;功能研究;疾病易患性
单核苷酸多态性(single nucleotide polymorphism,SNP)是指不同个体间同一序列单个核苷酸
的差异(单碱基转换、颠换、插入和缺失),一般表现为二等位多态性单碱基的颠换、替换。早在1996年美国学者Lander将其列为继限制性片段长度多态性和微卫星多态性之后的第三代DNA遗传标记[1]。SNP具有密度高、易于自动化分析等优点。因此,它一经出现就很快应用于以统计遗传学为基础的复杂性疾病易患性研究[2]。而全基因组关联分析更是将这种研究推到一个新的高度[3],目前已有阿尔茨海默病、乳腺癌、糖尿病、冠心病等一系列复杂疾病完成了全基因组关联的分析研究[4]。此外,SNP在人和种族间分布频率也有差异,因此也可以为研究人类进化的历史提供依据[5-6]。然而,随着研究的深入,研究者们发现以往的关联研究仍然存在弊端,主要是由于传统统计学方法存在一定犯一类错误的概率,而经典的基因分型技术(如限制性片段长度多态性、TaqMan实时定量PCR技术等)在SNP的鉴别方面也存在较大主观性。为了筛选真正具有功能的多态性位点,SNP的功能研究应运而生,研究者应用质粒转染、电泳移动漂移实验(electromobility shift assays,EMSA)以及染质免疫沉淀(chromatin immunoprecipitation,ChIP)等技术从大量潜在的易患位点中鉴别出真正具有功能的SNP位点。
1 SNP在结构基因各区域的分布
结构基因是一类编码蛋白质(或酶)或RNA的基因。人类结构基因4个区域包括:①基因调控区,包括启动子和增强子等;②基因前导区,位于基因编码区上游,相当于mRNA 5'末端非翻译区(5'untranslated region,5'UTR);③基因外显子与内含子区;④基因尾部区,位于基因编码区下游,相当于mRNA 3'末端非翻译区(3'UTR)。SNP在结构基因的4个区域都有分布,其主要分布于基因的调控区和UTR以及编码区,而外显子的SNP相对较少,其变异率仅为周围序列的 1/5,且频率较低[7-8]。
2 不同区域SNP的功能研究方法
2.1 启动子区、增强子区和尾部3'UTR的SNP功能及其研究方法 启动子区与结构基因的转录起始有关,该区域出现的SNP位点可能影响转录因子与顺式作用元件的结合效率,进而改变该结构基因mRNA或该蛋白质的表达水平;而增强子区的SNP位点则可能通过改变增强子的结合效率,增强或减弱相关基因的表达[9]。近年来发现,microRNA(miRNA)与结构基因mRNA的3'UTR相互作用可以调控靶基因的表达[10-13],而3'UTR位点和miRNA的前体(pri-miRNA)的多态性可能促进或减弱该结构基因mRNA的降解过程[14]。由于以上三种区域位点的多态性均对结构基因表达有影响,在研究方法上存在一定相似性。
2.1.1 构建重组质粒载体并转染细胞后检测荧光素酶活性 如前所述,启动子区出现的SNP位点可能影响转录因子与顺式作用元件的结合效率,进而改变相关基因的表达。目前使用较广泛的证明方法是双荧光素酶基因检测报告系统,其以萤火虫荧光素酶作为实验报告基因检测不同基因型启动子或增强子的转录效率,同时以海洋海肾荧光素酶作为对照报告基因来减小实验的误差。在肿瘤抑制因子p53相关调节因子小鼠双微体2基因的启动子研究中,Bond等[15]将转录激活因子和带有SNP309位点(rs2279744)不同基因型的小鼠双微体2基因启动子质粒共转染入黑腹果蝇胚细胞系SL2,发现转染启动子G基因型的细胞,其荧光水平显著高于T基因型,从而证明SNP309 G/G基因型能提高小鼠双微体2因子的表达水平。在对细胞素P450-家族2-亚家族A-肽6基因增强子的SNP功能研究中,Pitarque等[16]将带有-1013位点不同基因型的基因5'上游区域连接入无启动子的pGL3(是一种商品化的重组质粒pGL3荧光素酶报告载体)荧光素酶报告载体,并将其转染入人类肝癌细胞系HepG2;通过荧光检测发现转染A基因型的细胞,其荧光水平显著高于G基因型,由此判断位于细胞素P450-家族2-亚家族A-肽6的基因启动子上游-1013位点的A基因型能增强基因的表达水平。
构建重组质粒载体的方法也可用于基因3'UTR区SNP的功能研究。与启动子区不同,3'UTR区的功能研究需在荧光素酶基因尾部插入含目的基因的3'UTR区序列,同时还需转染入特定
miRNA的片段。根据转染miRNA种类的不同,目前分为两种研究方法:①构建含miRNA前体pri-miRNA的表达质粒载体,然后与含3'UTR位点的质粒载体共转入相关哺乳动物细胞;②在体外人工合成前导pre-miRNA分子,再与含3'UTR位点的质粒载体共转入细胞。在乳腺癌易患性研究中,Nicoloso等[17]将带有转化生长因子β受体1基因3'UTR区rs334348不同基因型的荧光素酶质粒和miR-628-5p分子共转染入MCF7细胞,发现转染G基因型的细胞,其荧光素酶活性低于A基因型,从细胞功能学方面证实rs334348在乳腺癌发病中的作用。在miRNA前体pri-miRNA中SNP对非小细胞肺癌易患性的功能研究方面,Hu等[18]将含有rs11614913不同基因型的miR-196a2前体质粒(或化学合成的不同基因型的成熟miR-196a2-3p miRNAs)与其靶基因-淋巴细胞特异蛋白3'UTR荧光素酶质粒分别共转染入中国仓鼠卵巢细胞、293T和A549细胞,发现转染C型的细胞的荧光素酶活性低于T型,从而证实rs11614913位点对靶基因表达的影响。
2.1.2 等位基因表达差异检测 等位基因差异表达的现象是在人类中发现的X染体失活[19]和基因印迹[20]后才引起重视的。人们发现无论是在常染体还是性染体,来自两个亲本染体上的某些基因并不是均等表达,而是受各自启动子或者增强子的DNA序列或者表观遗传修饰的影响而产生不同的转录效率。如果该基因的编码区存在SNP,并且这个SNP的遗传变
化与调控区的基因变化存在一定连锁关系,则可以SNP为标记来计算等位基因差异表达的程度。以往SNPs的研究方法多是从体外研究或者通过多个个体的体内研究进行证实,除受SNPs影响外,还有外界环境等其他因素的影响。检测杂合个体的等位基因差异表达可以有效地解决这一瓶颈,其在同一杂合子个体内检测不同等位基因下SNPs的表达量,从而在体内确定SNPs这个单一因素对基因表达量产生的影响。
目前等位基因差异表达的研究方法很多,包括PCR-限制性片段长度多态性、单链构象多态性以及高通量测序技术。其中运用最为成功的是高通量测序技术,与其他技术相比,它无疑具有更为简便、高效、精确等特点。已有研究发现,编码烟碱受体α5亚基的基因启动子SNPs与尼古丁成瘾和肺癌等多种疾病有关,然而原因尚不十分清楚。Smith等[21]在对人脑额叶前部皮质尸检组织的杂合样本进行测序后发现,烟碱受体α5亚基基因5'端上游增强子区中有6个相互连锁的SNPs位点能够解释>2.5倍的等位基因表达差异,从而证实了这些基因在基因表达中的作用。
同理,等位基因差异表达的研究方法也可以用于基因3'UTR区SNPs的功能研究。Kim等[22]分别对不同组织中miR-1、miR-133和miR-122的靶基因结合位点上的SNPs进行等位基因测
序发现,与miR-122结合的28个靶基因位点SNPs,其杂合子在肝组织中有差异表达,而在肌肉组织中却未发现差异表达,由此不仅证明了这些SNP的生物学功能,也说明在不同组织中miRNA作用位点的多态性能导致基因的表达差异。
2.1.3 EMSA EMSA 是一种研究 DNA、蛋白质或RNA与蛋白质相互作用的常用技术,其原理是基于与蛋白质结合的DNA或RNA复合体在聚丙烯酰胺凝胶中电泳时其迁移率小于未结合蛋白质的DNA或者RNA。目前,该技术已经用于定性和定量分析带有SNP的基因序列(如基因启动子和增强子等)与核蛋白转录因子的结合效率。
Knight等[23]通过 EMSA 发现,肿瘤坏死因子(tumor necrosis factor,TNF)基因 -376位点的 A基因型能够增强与转录因子OCT-1的结合,而这种结合能力的提高可以促进TNF基因转录从而导致脑型疟疾的发生。Bcl-2基因是人体内重要的细胞凋亡调节基因,Nuckel等[24]通过EMSA及相关蛋白质定量实验证明-938C基因型可与转录激活因子相互作用,从而降低Bcl-2蛋白的表达,而-938A基因型则可能成为慢性B淋巴细胞白血病遗传易患性的一个新的遗传标记。
2.1.4 ChIP ChIP分析是基于体内分析发展起来的方法,其可以在活细胞状态下固定并且富集
蛋白质-DNA复合物,再通过对目的片段的纯化与检测,从而获得蛋白质与DNA相互作用的信息。与EMSA技术相比,ChIP更能真实、完整地反映结合在DNA序列上的调控蛋白,是目前确定与特定蛋白质结合的基因组区域或与特定基因组区域结合的蛋白质的最好方法。
Zell等[25]在研究鸟氨酸脱羧酶基因时发现,启动子区+316位点的SNP与结直肠癌患者的生存率有关,并通过ChIP等技术证实该位点的A基因型与激活因子c-MYC、抑制因子MAD1和MAD4的结合能力强于G基因型。Oishi等[26]在研究与心血管疾病有关的介导组织重构的转录因子时,应用ChIP技术证实该基因启动子区的-1282位点能够与心肌细胞增强因子相互作用;并通过构建重组荧光素酶表达载体,证实-1282位点的G基因型能干扰心肌细胞增强因子在该位点的结合,从而减少KLF5基因的启动子对血管紧张素Ⅱ的应答。
2.1.5 蛋白质免疫技术 蛋白质免疫技术在SNP的功能研究中应用较多的是蛋白质免疫印迹技术和酶联免疫吸附测定技术。它们均以抗原、抗体特异性结合为原理,用于检测不同基因型下特定蛋白的表达。与其他检测基因表达方法相比,其更有利于从基因转录后修饰水平上验证某种SNP对其基因表达的影响。
二氢叶酸还原酶(dihydrofolate reductase,DHFR)的表达与抗肿瘤药物甲氨蝶呤的耐受性有
关,DHFR的3'UTR是miR-24保守结合位点之一,Mishra等[27]通过Q-PCR对DHFR mRNA的定量和免疫印迹对DHFR蛋白质的定量发现,DHFR基因3'UTR的829C→T突变能干扰 miR-24的结合功能并减弱miR-24对DHFR mRNA降解作用,增加个体对甲氨蝶呤的抗药性。除3'UTR的SNP可能引起蛋白质表达量改变外,启动子区或者增强子区的SNP也同样可能引起相应蛋白质表达量的变化。Sinha等[28]研究发现恶性疟原虫疟疾的严重程度与TNF基因的多态性有关,通过对印度55个民族的1871名志愿者的外周血白细胞样本的TNF基因的SNPs进行基因分型,并用酶联免疫吸附测定技术对TNF定量后发现TNF增强子区的-1031CC型和-863AA型纯合子提高TNF产量,而高TNF含量又与恶性疟原虫疟疾有关。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。