Conting(叠连):又译作连续克隆系。为搞清某段DNA的排列顺序而建立的一组克隆。被克隆的DNA小片段有相互邻接并部分重叠的关系,从而可以完全覆盖该段DNA,一个这样的克隆即为一个conting
功能域:蛋白质中具有某种特定功能的部分,它在序列上未必是连续的。某蛋白质中所有功能域组合起来决定着该蛋白质的全部功能。
基因组:某一物种的一套完整染体组中的所有遗传物质。其大小一般以其碱基对总数表示。
基因组学:从事基因组的序列测定和表征描述,以及基因活性与细胞功能关系的研究。
人类基因组计划HGP主要目标:提供公开的完全的高质量的含有30亿bp的人类基因组全序列。
生物信息学:是分子生物学,信息技术与科学,物理学,数学等学科交叉,结合的产物。其研究核心是基因组信息学及蛋白质组学。
序列标签位点:人类基因组中只出现一次的位置和序列已知的长度约为200~~500bp的特定DNA序列。
人工神经网络:是对人类大脑特性的一种描述。简单地讲,它是一个数字模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法。
一级数据库:数据库中的数据直接来源于试验获得的原始数据,只经过简单的归类整理和注释。
二级数据库:根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建具有特殊生物学意义和专门用途的二次数据库。
直系同源:是指来自于不同物种的由垂直家系(物种形成)进化而来基因,并且典型的保留与原始基因有相同的功能
旁系同源:指同一基因组(或同系物种的基因组)中,由于始祖基因的加倍而横向产生的几个同源基因,可能会进化出新的与原来有关的功能。
分子钟:某一种蛋白质在不同物种间的取代数与所研究的物种间的分歧时间接近正线性关系,从而将分子水平的这种恒速变异称为“分子钟”。
蛋白质组:由一个细胞或一个组织的基因所表达的全部相应的蛋白质
数据库查询:指对序列,结构以及各种二次数据库中的注释信息进行关键词匹配查
数据库搜索:是指通过特定的序列相似性比对算法,出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。
1、人工神经网络是一类仿生物神经网络原理的信息处理系统,它与传统的信息处理系统有着本质的不同,以并行性,非线性,容错性和自学性为主要特点。
4、识别基因的两个途径:基因组DNA的外显子识别。基于EST策略的基因鉴定
6、生物芯片主要特点是 高通量微型化自动化
7、目前国际上按检测目标分类,将生物芯片主要分为 基因芯片蛋白芯片芯片实验室
8、用于基因的病毒载体应具备以下3个基本条件:携带外源基因并能包装成病毒颗粒数据库学什么介导外源基因的转移和表达对机体不致病
9DNA序列分析:基因预测酶切位点分析序列比对等。
10、在进行序列两两比对时,有两方面问题直接影响相似性分值:取代矩阵 空位罚分
11、人工神经网络的学习方式可分为三种:有导师的学习,无导师的学习,再励学习。
12、寻药物作用靶标的方法主要包括:表达序列标签数据库搜寻,综合分子特征方法,结构生物方法
13、三维结构搜寻的药物分子设计中三维结构搜寻过程一般包括四步:定义提问结构,解释提问结构,对数据库进行二维及三维关键部位筛选对初筛合格的结构,应用三维限制条件进行逐个原子印证
14、蛋白质组研究的三大关键核心技术是:双向凝胶电电泳技术,质谱鉴定技术,计算机图像数据处理与蛋白质组数据库
15、 蛋白质序列分析包括:亲疏水性分析,磷酸化位点,序列比对
16.生物信息数据库的四个类型:基因组数据库核酸和蛋白质一级结构序列数据库生物大分子(主要是蛋白质)三维空间结构数据库、以上3类数据库和文献资料为基础构建的二次数据库。
17.蛋白质二级结构:经验算法,物理化学方法,机器学习法
  蛋白质三级结构:同源建模法,反向折叠法,从头预测法
国际上主要的三大核酸数据库:EMBLGenBankDDBJEMBL是由欧洲分子生物学实验室于1982年创建的,其名称也由此而来,目前由欧洲生物信息学研究所负责管理。美国国家健康研究院(简称NIH)也于80年代初委托洛斯阿拉莫斯国家实验室建立GenBank,后移交给国家生物技术信息中心NCBI,隶属于NIH下设的国家医学图书馆(简称NLM)。DDBJDNA Data Base of Japan的简称,创建于1986年,由日本国家遗传学研究所负责管理。1988年,EMBLGenBankDDBJ共同成立了国际核酸序列联合数据库中心,建立了合作关系。根据协议,这三个数据中心各自搜集世界各国有关实验室和测序机构所发
布的序列数据,并通过计算机网络每天都将新发现或更新过的数据进行交换,以保证这三个数据库序列信息的完整度。
序列比对的数学模型:序列比对的数学模型大体可以分为两类,一类从全长序列出发,考虑序列的整体相似性,即整体比对;第二类考虑序列部分区域的相似性,即局部比对。局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。
举例简述BLAST程序包含的几个子程序
1blastp是蛋白质序列到蛋白质质库中的一种查询。库中存在的每条已知序列将逐一地同每条查询序列作一对一的序列对比。2blastx是核酸序列到蛋白库中的一种查询。现将核苷酸序列翻译成蛋白质序列(一条核苷酸序列可能会被翻译成六条蛋白质),再对每一条做一对一的蛋白序列比较。3blastn是核酸到核酸库中一种查询。库中存在的每条已知序列都将同所查序列作一对一的核酸序列比较。4tblastn是蛋白序列到核酸库中的一种查询。与blastx相反,它是将库中的核酸序列翻译成蛋白序列,再同所查询序列做蛋白对蛋白
的对比。5tblastx是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列产生六条可能蛋白序列),这样每次对比都会产生36中对比阵列。
序列分析的算法有哪些:点阵法、半经验的直观算法、动态规划算法、启发式算法、并行算法、神经网络和隐藏马尔可夫模型等
人工神经网络的特点1、高度的并行性;2、高度的非线性全局作用;3、良好的容错性和联想记忆能力;4、很强的自适性和自学能力。
三种构建进化树的方法并简述之:
三种主要的建树方法分别是距离、最大节约和最大似然。
距离法考察数据组中所有序列的两两对比结果,通过序列两两之间的差异决定进化树结构和树枝长度。
最大节约方法考察数据组中序列的多重比对结果,优化出进化树能够利用最少的离散步骤去解释多重比对中的碱基差异。
最大似然方法考察数据组中序列的多重比对结果,优化出拥有一定拓扑结构和树枝长度的进化树,这个进化树能够以最大的概率导致考察的多重比对结果。
蛋白质二级结构的预测方法:1、统计/经验算法,如基于经验统计规则的Chou-Fasman方法及基于信息论算法的GOR方法;2、物理-化学方法,基于对于蛋白质结构的物理及化学原理的预测,如Lim方法;3、机器学习方法,如神经网络方法。
同源建模的基本步骤1、目标序列与模板序列的匹配;2、根据同源蛋白质的多重序列匹配结果,确定同源蛋白质的结构保守区以及相应的框架结构;3、目标蛋白质结构保守区的主链建模;4、目标蛋白质结构变异区的主链建模;5、侧链的安装和优化;6、对模建结构进行优化和评估。
当前生物信息学在基因组研究中当前的主要研究内容是什么?
1人与各种生物的完整基因组的获取和信息分析2新基因和新的单核苷酸多态性(SNP)的发现与鉴定:a,基因的电子克隆;b,从基因组DNA序列中预测新基因:发现SNP3基因组中非编码区信息结构分析;4遗传密码起源与生物进化的研究;5完整基因组的比较研
究;6大规模基因功能表达谱的获取与分析;7蛋白质结构模拟与药物设计;8生物信息学的应用与发展研究:a,疾病相关的基因信息及相关算法和软件开发;b,建立与动植物良种繁殖相关的基因组数据库,发展分子标记辅助育种技术;c,研究与发展药物设计软件和基于生物信息的分子生物学技术。
生物信息学在基因组研究中的发展趋势:1高度自动化的实验数据获得、加工和整理;2序列片段拼接;3基因区域的预测;4蛋白质结构预测;5分子进化研究等。
什么是“后基因组计划”?“后基因组时代”生物学的主要任务是什么:
“后基因组计划”基因组全序列完全测定完成后,对基因组的结构、表达、修复、功能等进行研究的计划.包括功能基因组、结构基因组和蛋白质组等研究的国际合作计划。
“后基因组时代”生物学的主要任务:揭示基因组及其所包含的全部基因功能,并在此基础上阐明遗传、发育、进化、功能调控等生物学基本问题,以及人类健康和疾病相关的生物医学问题。其核心科学问题主要包括:基因组多样性,基因的表达调控和蛋白质产物的功能,以及模式生物基因组研究等。
蛋白质组研究的技术路线:1蛋白质样品制备;2蛋白质的双向聚丙烯酰胺凝胶电泳(2-DE);3蛋白质染;4凝胶图像分析;5蛋白质特异点的鉴定。队特意蛋白质点进行:a,氨基酸组成分析;b,氨基酸序列分析;c,质谱分析等;6蛋白质数据库配比分析。
简述蛋白质组研究的理论基础
1、从mRNA表达水平 并不能预测蛋白表达水平。有人研究了mRNA和蛋白质表达的关系,以处于对数生长期的啤酒酵母为研究对象,mRNA的表达由SAGE频率表指示,同位素标记酵母蛋白,共选择80个基因,结果没有发现翻译和转录丰度有明显相关。2、蛋白质的动态修饰和加工并非必须来自基因序列。在mRNA水平上有许多细胞调节过程是难以观察到的,因为许多调节是在蛋白质的结构域中发生的。许多蛋白只有与其它分子结合后才有功能,蛋白的这种修饰是动态的、可可逆的,这种蛋白修饰的种类和部位通常有能由基因序列决定。3、蛋白质组是动态反映生物系统所处。细胞周期的特定时期、分化的不同阶段、对应的生长和营养状况、温度、应激和病理状态所对应的蛋白质组是有差异的。蛋白质组学的研究可望提供精确、详细的有关细胞或组织状况的分子描述。因为诸如蛋白质合成、降解、加工、修饰的调控过程,只有通过蛋白质的直接分析才能提示。
对于给定的模型和观察值序列,求可能性最大的状态序列。3,学习问题:对于给定的一个观察值序列,如何根据此序列调整参数{A,B,},获得合适的模型。
简述DNA复制的特点
1、半保留复制:两个子代分子中各有一条链是来自亲代的旧链。两条链均可作为模板2、复制子:基因组中能独立进行复制的单位称为复制子。即从复制的起点(origin)到复制终止的终点(terminus)的区域3、复制的方向:大多数细胞及许多病毒的DNA都是双向等速复制。即两个复制叉反向对称行进,直到遇到相邻的复制叉。4、半不连续复制:前导链leading strand :3'5'方向的母链为模板时,复制合成出一条5'3'方向的链。其合成方向与复制叉的行进方向是一致的,而且是连续的。滞后链lagging strand,或叫随从链:以5'3'方向的母链为模板时,合成方向与复制叉相反,且不连续,产生冈崎片段(Okaxaki fragments

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。