第十五章可遗传的基因组变异与人类疾病易感性
第一节基因组具有可遗传的变异和遗传多态性
一.人类基因组中存在三条主要的遗传变异
●基因组具有遗传所要求的稳定性和适应环境所要求的可变性,两者之间必须维持一
个恰到好处的平衡,这样才能使生物体得以生存并世代相传。
●人中的基因组变异主要体现在大量非编码的序列的重复序列、遍布与基因组的单
个碱基变异,包括单核苷酸多态性(SNP)及点突变。
(一)简单的短串联重复序列可形成多态性
人类基因组重复序列大致分五类:(1)、转作子来源的重复序列; (2)、细胞基因
的反转录拷贝,如假基因;(3)、简单重复序列(simple sequence repeat, SSR);(4)、片段性重复序列;(5)、存在于着丝粒和端粒区附近的串联重复序列块。
●SSR:占人类基因组的3%,“简单”体现在具有短的重复核心序列单元。
◆复制过程中由DNA多聚酶的经常性滑动造成的。
●1、重复单元的碱基数n=1~13 微卫星DNA(microsatellite DNA)
⏹频率最高的是二核苷酸重复,如(AC)n,(A T)n。
⏹其序列特征是可变数目串联重复序列(variable number of simple tandem
repeat polymorphism,VNTR),其存在展示了人中的一种高度的长度多态
性。
●2、重复单元的碱基数n=14~500 小卫星DNA(minisatellite DNA)
⏹一般位于靠近染体末端的区域。其中一些是高变的小卫星DNA序列,
重复单位之间的序列有很大不同,但都含有一个基本的核心系列,多靠近
端粒。另一类是端粒DNA,有6核苷酸重复单位(TTAGGG)组成。
(二)单个核苷酸置换可以形成多态性
单核苷酸多态性(single-nucleotide polymorphism.SNP)是指出现在基因组DNA分
子的特定位置的单个核苷酸的置换,其变异在人中出现的频率大于1%。单核苷
酸插入/缺失变异也属于广义的SNP。
●SNP:1996年美国麻省理工学院(MIT)的人类基因组研究中心负责人Lande ES
作为第三代遗传标记提出。
⏹绝大多数SNP为双等位型(bi-alleles),或称二态,即一对同源染体上
同一位点二个碱基对发生变异的状态。
⏹按其分布分为:非编码区的基因外SNP(perigenic SNP, pSNP)和基因间
SNP(intergenic SNP, iSNP);编码区的编码区SNP(coding-region SNP,
cSNP)。
⏹数目:目前已在dbSNP存放的人基因组SNP数目以超过900万个
(/)。
(三)点突变是指频率非常低的核苷酸置换和微小DNA序列变异
●点突变的严格定义是指DNA序列中的单个碱基的置换,包括转换和颠换。
●从对基因功能的影响划分:同义突变、错义突变、无义突变、移码突变、转录
突变或启动子突变、剪切位点突变和多聚腺苷尾信号突变等。除同义突变外均
是致病突变。
●沉默突变(silent mutation)指不引起明显表型变化的DNA变异。
1.同义突变
2.中性突变(neutral mutation)指导致氨基酸发生了替代,但不蛋白功能的
变化,也称中性替代(neutral substitution)。
●致病性点突变在基因组上的分布通常是“孤立”的,通常发生在那些编码蛋白
的结构基因上。
二.DNA变异可影响基因功能
(一)基因内变异易导致基因的功能改变
●发生在结构基因上的DNA变异更多的是通过改变转录蛋白因子的结合活性或
使其产生多样性组合,或引起可变剪接(alternative splic ing)来影响基因的表
达功能。如:apoE基因。
(二)调节序列变异主要影响基因的表达水平
●常见发生在启动子区的点突变。如人类遗传性胎儿血红蛋白持续增多症
(HPFH),是发生在γ基因启动子区的一些点突变。
●有些发生在远离基因的顺式调节元件,如增强子(enhancer)和座位调控区(locus
control region,LCR)等“远程”调控序列,这些序列发生点突变或其基序的
改变,可以影响它们所调节的靶基因的表达水平。
(三)动态突变是重复序列拷贝数扩增而形成的变异
●动态突变(dynamic mutation)是指DNA中的一些特定的短核苷酸序列单元(主
要为三核苷酸,如CAG,CGG,GTG)的拷贝数发生扩增而产生的突变。又称
扩增重复序列(expanded repeats)。
●特征:正常等位基因的这种重复序列的拷贝数低,而突变等位基因的拷贝数明
显增加。
●脆性X综合征,X染体上的FMR-1基因的5’端非翻译区有一段不稳定的CGG
三核苷酸重复序列扩增所致。
(四)重复序列拷贝数异常也可形成稳定的遗传变异
● 如:多并指(趾)症(synpolydactyly ,SPD )和手-足-生殖畸形综合征(hand-foot-genital
syndrome , HFGS )。
三.DNA 多态性是遗传学研究的重要工具
(一) DNA 多态性标记有三种类型
STR ●
SNP ● 限制性片段长度多态性(restriction fragment length polymorphism , RFLP )
(二) 国家人类HapMap 计划简介
● 国际人类基因组单体型图计划(International HapMap Project )是人类基因组图计划
(HGP )延伸出来的以阐述人类DNA 序列遗传变异为目标的基础性研究课题。 ● 单体型:单倍体染体上作为一个整体遗传的DNA 片段,或描述为特定染体区
域的一组等位基因组合。
四.复杂性状疾病是由遗传和环境相互作用导致的多基因病
(一) 复杂性状具有三种遗传学特点
● 复杂性状(complex traits ):也称多因子性状(multifactorial traits ),指由遗传和环
境相互作用所决定的生物性状。
● 复杂性状的特点:
1. 复杂性状的表型是由遗传和环境因素共同决定。
人中遗传因素造成的表型变异占总的表型变异的比例称为遗传度(heritability )。复杂性状疾病的遗传度介于0到100%之间。
2. 复杂性状的表型为数量性状或称连续性状
呈现出正态分布的“鈡形”。
3.复杂性状的遗传方式为非Mendelian遗传
复杂性状由多基因控制,这些基因的效应为共显性。根据功能分为:主基因
(major gene)、微效基因(minor gene)和修饰基因(modifier gene)。
(二)复杂性状疾病使多基因与环境因素引起的疾病
●复杂性状疾病(complex diseases):也称多基因病或多因素疾病(polygenic diseases,
multifactorial disorders),由两对或两对以上的多基因遗传因素与环境因素共同作用
而引起的疾病。
●易患性(liability):遗传和环境共同作用决定一个个体是否易于患病。
五.复杂性状疾病的“致病”基因为易感基因
(一)数量性状位点和易感基因的概念
●数量性状位点(quantitative trait locus,QTL):多基因病性状控制基因的染体座
位。是通过对复杂性状的统计学分析获得的染体上的遗传位点,若干个或很多个
位点的等位基因相互作用能够影响复杂性状的表型。
●易感基因(susceptibility gene):复杂性状疾病“致病”的基因,是一些微效基因,
也就是存在于QTL中的等位基因,他不决定疾病本身,而是决定对疾病的遗传易
感性,是否发病取决于多遗传因素的累加效应和与环境的相互作用。
(二)遗传变异是疾病易感性的基础
●人中个体对常见复杂疾病的易感性差异可以理解为遗传变异驱动的事件,与此相
关的遗传变异也应该是人中的常见等位基因,其中最具有代表性的是SNPs。三.连锁分析和相关分析是鉴定易感基因的两种技术策略
(一)连锁分析基于家系而相关分析基于人
●连锁和相关的概念
1.连锁(linkage):是染体上基因位点的位置关系,任何位于两个连锁的标记
位点间的等位基因或等位位点都与这两个标记一块被遗传。
2.相关(association):指两个特性(对象)在人中的统计学关系,其内涵使两
个事件是否具有统计学意义的相关性。
●连锁分析和相关分析是分别基于家系和人的基因鉴定策略
1.连锁分析:通过对家系成员进行基因型—表型分析,确定那哪些分子标志(基
因型)是与被研究的性状(表型)共遗传即连锁的。是单基因疾病致病基因鉴
定的主要手段。
2.相关分析:在体水平寻基因组内某一遗传位点的特定等位基因或遗传多态
性与疾病的相关程度,属于病例—对照研究(case-control study),不依赖于家
系的收集。更适用与复杂性疾病致病基因鉴定。
基因多态性Comparison of linkage analysis and association study
GRR:genotype relative risk
(二) 全基因组扫描相关分析的基本原理
●基因作图(gene mapping):是表型驱动的基因鉴定方法,指通过全基因组扫描和
连锁不平衡分析获得具有统计学意义的与表型连锁或相关的染体区段或DNA多
态性,其目的是获得复杂疾病基因QTL的染体定位。
●全基因组扫描:是指选择基因组内分布相对均匀的一组多态性DNAmaker,对人“整
个”基因组DNA进行遗传标记物检测(频率分析),其目的是获得被测对象的人
基因组中可覆盖不同座位(区域)的“全貌”DNA多态性信息图。
●连锁不平衡(linkage disequilibrium,LD): 在某一体中,不同座位上某两个等位
基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象,称
连锁不平衡(linkage disequilibrium)。
●LD分析(LD analysis):是一种比较患病个体和正常个体样品(或疾病染体和对
照染体)间标记等位基因频率的分析方法,它所针对的分析对象是体样品,即
应用统计学原理来评估和检验二组标记等位基因频率的差异。也就是分析病例组和
对照组的人中的的同时位点SNPs与tagSNPs的非随机相关性,可以理解为基于
SNP的单倍体型分析的LD检验。
第三节遗传变异决定遗传易感性
一.apeE基因型与某些人类多基因病相关
●apoE是载脂蛋白E(ApoE)的编码基因,位于染体19q13.12,是人中具有高
度多态的基因,其中的3类为常见类型的等位基因,即apoEε2(E2)、apoEε3(E3)、和apoEε4(E4)。
1.E3:野生型
2.E4:增强型,E3的112位T置换成C变异导致Arg变成了Cys,是多种胆固
醇升高引发疾病的原因。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。