ITS序列分析相关的名词解释--688IT编程网

1 DNA分子标记：在DNA分子上检测生物间的差异，是DNA水平遗传变异的直接反映。DNA分子标记能对各个发育时期的个体、各个器官甚至细胞作检测，不受环境与基因表达与否的限制，数量极多，遍及整个基因组，多态性高，遗传稳定

DNA条形码-新的生物身份识别系统（以染体组为基础）：利用标准的、有足够变异的、易扩增且相对较短的DNA片段对物种进行快速、准确地自动鉴定。与传统鉴定方法的理论基础不同，DNA条形码技术基于物种基因型的差异，而不是环境密切相关的表现型，克服了传统鉴定方法的诸多缺陷，具有鉴定结果准确、可重复性良好、方法通用性强等优点。还有助于发现新种和隐种。

DNA条形码的优点：1 以信息稳定的DNA序列为检测对象，每一物种具有各自特定的DNA序列信息，同种生物不同生长期具有相同的DNA序列信息，即使经过加工使其形态发生变化，但其DNA序列信息不会改变，而传统形态学鉴定特征会因趋同性和变异导致鉴定错误；与传统分类方法相比，DNA条形码技术矿大了检测样本的范围，即使样本部分受损也不会影响鉴定结果。2 能够抛开形态相似的假象，从基因水平上对传统分类方法难以区分的类进行物种鉴定。3 建立DNA条形码数据库，不但可以一次性鉴定大量物种，而且可以提供各物

种的明确信息；不仅能够弥补传统分类学对物种形态描述的不足，而且还可以加快对已知物种的识别速度；同事有助于发现新物种。4 在DNA条形码技术的基础上研制简便和高效的条形码扫描仪，可以加快物种鉴定和进化研究的步伐，有益于推进分类学研究基础薄弱的国家，尤其是发展中国家物种鉴定及进化研究的步伐。

传统鉴定（中药材四大传统鉴定方法：基原鉴定、性状鉴定、显微鉴定和理化鉴定）的缺点：基原鉴定和性状鉴定难以区分形态性状相似的近缘种，且药用植物形态性状易受地理生态环境、生长期等因素影响，从而影响鉴定结果的准确性；理化鉴定中的活性成分易受其生理条件、采收时间的因素的影响，同时对化学成分相似的物种也较难区分。

2 ITS序列：在 rDNA 基因中，16S rDNA 和 28S rDNA 基因间隔序列称为（ITS）。非编码区

用途：在种间及种下居间具有进化速率快，变异程度高、区分物种能力强的特点，适用于药用植物与其近缘种类等较低分类阶元的分子鉴定。

6 非转录间隔区：DNA分子中，不同基因（操纵子）之间的非转录序列

7 保守序列：指DNA分子中的一个核苷酸片段或者蛋白质中的氨基酸片段，它们在进化过程中基本保持不变。

10 信息位点：信息位点就是指能由位点产生的突变数目把一棵树与其它树区分开来的位点。信息位点是指那些至少存在2个不同核苷酸且每个不同核苷酸至少出现两次的位点。

11 系统学:是提炼系统论、信息论、控制论的共同基础理论而形成的一门学科，建立系统科学基础科学的这种系统学是由中国学者钱学森所倡导

12 指纹图谱：中药指纹图谱是指某些中药材或中药制剂经适当处理后，采用一定的分析手段，得到的能够标示其化学特征的谱图或光谱图。

13 遗传多样性：遗传多样性又称为基因多样性。是生物多样性的重要组成部分。同种个体间因为其生活环境的不同，经历长时间的天择、突变所产生的结果。如果遗传多样性越高，则族中可提供环境天择的基因愈多；相对的，对于环境适应能力就愈强，有利于族的生存及演化。

14 RAPD技术：随机扩增多态性DNA，是一种基于PCR的分子标记。利用随机引物对基因

组DNA进行扩增，由于引物在DNA模板上的结合位点不同，所以就可以扩增出不同长度的多态性片段，是基于全基因组水平上检测DNA变异的一种快速、有效的技术体系。

15 亲缘关系：生物类在系统发生上所显示的某种血缘关系

17 系统发育树：进化树的构建是一个统计学问题，我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。进化树由结点和进化分支组成，每一结点表示一个分类学单元（属、种、个体等），进化分支定义了分类单元（祖先与后代）之间的关系，一个分支只能连接相邻的节点。进化树分支的图像称为进化的拓扑结构，其中分支长度表示该分支进化过程中变化的程度，标有分支长度的进化分支叫标度枝。校正后的标度树常常用年代表示，这样的树通常根据某一或部分基因的理论分析而得出。进化分支可以没有分支长度的标注，没有被标注的分支长度不表示变化的程度，随让分支的有些地方用数点进行了注释。无根的树只是指明了种属的相互关系，没有确认共同祖先或进化途径。

目的：建树的目的是为了检验每个物种的单系性，即同一个物种的不同个体能否紧密聚集在一起

18 genbank:是由NCBI编护的DNA和RNA序列数据库为了分析核酸和蛋白质序列中所含有的生物信息，众多研究机构开发了专业性的

19 FAS格式：FASTA格式-由于genbank与EMBL数据格式比较复杂，为了分析的方便，出现了FASTA格式。是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码，且允许在序列前添加序列名及注释。

20 clustalX2.0:是一种渐进的比对方法，先将多个序列两两比对构建距离矩阵，反应序列之间两两关系；然后根据距离矩阵计算产生系统进化指导树，对关系密切的序列进行加权；然后从最紧密的两条序列开始，逐步引入邻近的序列并不断重新构建比对，知道所有序列都被加入为止。

clustalX为进行多重序列和轮廓比对和分析结果提供了一个整体的环境序列将显示在屏幕的窗口中，利用了彩的模式可以在比对中加亮保守区的特列。窗口上面的下拉菜单可以让你选择传统多重比对和轮廓比对需要的所有选项。

Clustal的渐进比对过程：在比对过程中，先对所有的序列进行两两比对并计算他们相似性

分值，然后根据相似性分值将它们分成若干组，并在每组之间进行比对，计算相似性分值。根据相似性分值继续分组比对，知道得到最终的比对结果。在比对过程中，相似性程度较高的序列先进行比对而距离较远的序列添加在后面。

序列相似性比较：就是将待研究序列与DNA或蛋白质序列库进行比较，用于确定该序列的生物属性，也就是出与此序列相似的已知序列是什么。

序列同源性分析：是将待研究序列加入到一组与之同源，但来自不同物种的序列中进行多序列同时比较，以确定该序列与其他序列之间的同源性大小。

多序列比对的意义：1 用于描述一组序列之间的相似性关系，以便了解一个基因家族的基本特征，寻motif，保守区域等。2 用于描述一个同源基因之间的亲缘关系的远近，应用到分子进化分析中。3 其他应用，如构建profile，打分矩阵等。

23 比对：比对是科学研究中最常见的方法，通过将研究对象相互比较来寻对象可能具备的特性。在生物信息学研究中，比对是最常用和最经典的研究手段。比对还是数据库搜索算法的基础，将查询序列与整个数据库的所有序列进行比对，从数据库中获得与其最相似

序列的已有的数据，能最快速的获得有关查询序列的大量有价值的参考信息，对于进一步分析其结构和功能都会有很大的帮助。

序列比对的理论基础是进化学说，如果两个序列之间具有足够的相似性，就推测二者可能有共同的进化祖先，经过序列内残基的替换、残基或序列片段的缺失、以及序列重组等遗传变异过程分别演化而来。序列相似和序列同源是不同的概念，序列之间的相似程度是可以量化的参数，而序列是否同源需要有进化事实的验证。

24 空位：（空位或缺失）在序列比对时，为了更好的匹配，需要适当加入空位，使序列之间所对应的相同碱基最多。

27 K-2-P双参数模型：生物条形码联盟( CBOLbootstrap检验方法) 推荐使用的距离计算模型

28 NJ法（基于距离的构建方法）：基本思想是反复将相邻点合成新的节点种，直到形成一个包含所有物种（通常用DNA或蛋白质序列表示）的节点种，其中相邻点是指具有最小速率校正距离的节点对。该方法以一颗星形树作为初始状态，首先将矩阵中具有最小速率校正距离的两个分类聚类，并计算新分类与剩余分类之间的距离得到新的距离矩

阵，至此完成算法的一轮计算，重复此过程，最终会得到一个以所有原始分类为叶节点的系统树。

通过各个物种之间的比较，根据一定的假设（进化距离模型）推导得出分类之间的进化距离，构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系

29 bootstrap:即自展值-自展支持率，是用来检验你所计算的进化树分支可信度的。简单地讲就是把序列的位点都重排，重排后的序列再用相同的办法构树，如果原来树的分枝在重排后构的树中也出现了，就给这个分枝打上一分，如果没出现就给0分，这样经过你给定的repetitions次（至少1000次）重排构树打分后，每个分枝就都得出分值，计算机会给你换算成bootstrap值。一般Bootstrap的值>50，则认为构建的进化树较为可靠。如果Bootstrap的值太低，则有可能进化树的拓扑结构有错误，进化树是不可靠的。

Bootstrap values （步长值）是指在你选择的遗传距离算法（一般选择邻接法即NJ法）中软件根据所比对序列得到结果比如 bootstrap value设置为1000，即软件构建了相应的1000”棵树“，在每个节点上显示的bootstrap value 即指在这1000次建树过程中，有相应的次数的频率这个分枝内的几株菌或几段序列在进化速度上相似，一般认为节点处的bootstra

p value大于500时分析结果可信，bootstrap value 在mega ,philiphy,等软件中常见。

通过系统发生分析推断出的树的不同部分可能有不同的置信度。自举检验(bootstrap test) 是一种重抽样技术，能粗略地量化这些置信度水平。造成统计误差的一个原因是数据采样误差，测量采样误差的一个好方法是，对于分析的对象多次采样，比较不同样本得到的估计值，估计值的分布可以说明一些问题。自举检验是一种现代统计技术，它使用与上述相同的原则，利用计算机随机地重采样数据，来确定采样误差和一些参数估计的置信区间。不同的是，我们并不进行实际的重采样，而是重采样数据的伪复本。

自举检验的基本方法是：从原数据集中抽取（同时替换）部分数据组成新的数据集，然后用这个新的数据集构造系统发生树。重复该过程，产生成百上千的重采样数据集，并同时生成对应的自举树，进而检验自举树对最终系统发生树各个分支的支持率。具体做法是，将最终系统发生树与各个自举树进行比较,其中，在各个自举树中都有出现或大量出现的那些部分将具有较高的置信度。产生相同分组的自举树的数目常常标注在系统发生树相应节点的旁边，表示树中每个部分的相对置信度。尽管有些系统发生树的构造方法会使自举过程非常耗时，但自举法已经成为系统发生分析中很受欢迎的算法。

33 DNA条形码的筛选标准：1 序列变异水平适宜，可以将不同物种彼此区分开来，同时种内变异较小2 变异区域两端的序列高度保守，可以设计在众多物种中物种中稳定扩增的通用引物3 扩增序列尽量短，最好一个反应可以完成测序4 使用的DNA条形码在分类学应用中应具有普遍意义5 具有可行的生物学分析方法。6 DNA条形码之间应具有互补性且不相关联，将准确鉴定的可能性最大化。（事实上，完美的植物DNA条形码并不存在）

688IT编程网

ITS序列分析相关的名词解释

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

ITS序列分析相关的名词解释

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式