分子进化分析软件MEGA 3.1的使用操作
作者:Dxyer- lzf战友
(山东大学生命科学学院微生物国家重点实验室)
受益的话,请到下列地址给我投一票,谢谢☺
www.dxy/bbs/post/view?bid=73&id=5059255&sty=1&tpg=1&ppg=1&age=0#5059255
进化树也称种系树,英文名叫“Phyligenetic tree”,主要通过蛋白质序列/核酸序列的同源性比较进而了解基因或物种进化发生的内在关系和规律。完整的进化分析需要以下几个步骤[1]:A.了解进化树的一些基本的概念和定义;B.集合一个待分析的数据组;C.对数据组进行多重序列比对;D.比对结果的校正;E.进化树的构建:为了说明进化分析结果的真实性,往往需要对校正后的比对结果选择不同的算法、模型和程序进行进化树的构建(必要的话,可利用Gblocks:molevol.ibmb.csic.es/Gblocks/Gblocks.html等软件提取数据组中的保守区后再进行进化树构建);F.树枝可信度评估:可利用bootstrap和interior-branch等测试方法;
G.发表数据的优化及展示:可利用MEGA3.1软件打开多种软件所做的进化树并对其进行分枝合并、排序等优化,最后利用Photoshop、Macromedia Fireworks MX 等作图软件对图的清晰度进行优化以获得高
质量的发表展示图.
目前树状进化树的分析软件很多,其中MEGA 3.1(asoftware/)[2]最大的优点在于易于上手操作并可对图形进行优化展示,是分子进化分析最理想的软件之一。但MEGA软件包中没有目前蛋白序列进化分析中推崇的“最大可能性(maximum likelyhood,ML)”和“贝叶斯推论(bayesian inferences)”这两种算法[3]。ML算法可使用软件phyml(atgc.lirmm.fr/phyml/),贝叶斯分析使用软件MrBayes(mrbayes.csit.fsu.edu/)。本文主要介绍分子进化分析软件MEGA 3.1的使用操作。
1.准备要分析的序列数据:
1.1 数据组的多重序列比对:
用clustal软件对序列进行比对分析(因任何软件都不能检测数据本身存在的错误,所以数据质量是进化树构建的关键,需要尽量保证输入数据的可靠性)。
使用2003年新版的clustalx1.83具有以下几个优点[4]:A.可将比对后序列保存为fasta格式;B. 可产生相似性的百分比矩阵;C. 可选定比对结果中需要
的比对序列区域段进行保存;D. 显著提高分析速度。
新旧版本执行时间比较
序列数目原始NJ算法时间完全比对时间新NJ算法时间完全比对时间200 0’6” 0’11” 0.1” 0’5”
500 6’55” 7’27” 1.1” 0’33”
1000 xxx xxx 16” 2’18”
注:若文件中序列名称过长,clustal则不好用。此时,选择用bioedit进行比对分析,则可不更改文件中的序列名称。利用bioedit比对后,将文件保存成fasta格式,则可直接用MEGA打开并对序列进行分析修
改。如此,利用bioedit和MEGA联合使用,则省去了来回更改序列名称的麻烦,且利于序列的修改和
各种格式转换。完整序列名称的*.txt,*.meg,*.mts文件,均可用MEGA软件直接打开,自行挑选序列进
行分析。
1.2 使用Bioedit等软件校对比对结果
可利用Bioedit:su.edu/BioEdit/bioedit.html等软件对比对结果进行
校正(尤其注意gap区的校正)并应将所分析序列的区域和长度截取至一致。
2.利用MEGA软件转换文件格式
双击打开MEGA软件,点击file,从下拉菜单中选择convert to mega fomat。
点击convert to mega fomat,弹出选择分析文件的对话框。点击对话框上的文件夹
图标(图1A),从目的文件夹中选中clustalx 比对分析后所产生的*.aln文件,点
击打开。此时即转换到准备分析的目标文件,点击ok,即可将*.aln文件转换成
*.meg文件。转换成*.meg文件后,会弹出转换后的*.meg文件和提示信息(图1B),
点击ok后,查看*.meg序列文件最后行是否正常,若存在clustax 的“.*:”符号行,
删除即可。点击保存即获得*.meg格式文件。float的常用属性值
图1.A. 弹出选择分析文件的对话框;B.转换*.meg文件后弹出的提示信息
3.导入*.meg文件准备数据分析文件格式转换app
最小化text数据窗口,剩下的界面同刚打开软件时的界面;点击file中的open
data,选则要分析的*.meg文件并打开;弹出对话框,选择目的序列的类型,再点击OK(图2)。以下操作说明以蛋白序列为例。
图2.弹出的数据类型对话框
4.数据选择及名称编辑
导入后,出现数据文件,点击工具栏上的选择和编辑数据/分类的图标(如图3A)即可弹出选择/编辑数据/分类的界面,可对要分析的序列进行选则,并可
进行文件名编辑(图3B)。编辑好后,点close即可。
注:软件还可以用于计算分枝间进化距离,group内的平均进化距离和group间的平均进化距离。
图3.A.选择/编辑数据/分类的图标;B.选择/编辑分类组界面
序列选择编辑好后,可点击保存进行序列输出,此时导出的序列为所选中的带钩的序列,非全部序列。点击OK后出现输出Exported Data文件,保存该文
件。Exported Data可直接用MEGA软件打开,以便今后直接利用。否则完全退出MEGA软件后,下次又需要重新进行序列的选择和编辑。
accept后接
count函数统计人数图4. 数据选择编辑后导出的Exported Data文件
5.进化树构建参数选择
将序列数据最小化后,可从Phylogeny下拉菜单中选择多种方法进行进化树的构建。常用Bootstrap tes
t进行进化树的构建,该选项下又有多种算法可以选择(常用邻位相接法:Neighbor-Joining)。当所分析的数据过多时,使用Bootstrap 测试法,所得分枝的支持率会显著下降,这时可选择Interior Branch test法对进化树分枝的支持率进行评估。Interior Branch test选项下也有两种算法。选择好算法后,弹出分析优选框,可点击绿图标,选择相应的分析参数和模式。设置好后,点击Compute进行分析(图5)。
图 5.分析参数和模式优选窗口
ascii码查询工具6.进化树的图形优化
计算好后,软件会自动弹出进化树。点击工具栏上的图标i(图6) ,会出现建树的参数信息;点击工具栏上的优选图标(图6),可进行进化树的各项参数优化。listview滚动条
图6.进化树窗口上的工具栏图标
点击优选图标后可以对进化树显示图形的多个参数进行优化。在Tree选项中(图7A),可选择各种形状的树;一般常用Rectangular Tree,在矩形树下可对已构建的树长、高进行调整。选中Branch(图7B),可对已构建的树枝上显示的信息进行修改;选中Hide values lower than,输入数据,可设置支持率?%以上的数值才显示;点击placement下拉框可选择数据值放置在树枝中的位置。选中 Labels(图7C),可对已构建的树枝的名称进行修饰;点击Shape下拉框,可选中形状;点击Color下拉框,可选中颜;设置好后,可选中窗口的相应名称,点击,即可对相对应的名称进行不同形状颜标识;误击时,从Shape中选择none 即可;选中另一类需标识的名称,设置好颜形状,依次对同类的
名称点击即可;均设置好后,点击OK即可看到优化后的进化树图形。
图7 进化树的优化选项设置
双击进化树图形中树枝的名称,也可对其命名进行修改、复制、剪切等。选中后,点击右键,进行复制等。
在进化树图形界面的右侧有聚集优化图标。选中聚集的分枝点,再点击工具栏中的聚集/舒展图标即可实现横三角与展开之间的转换,将同一体或特征的基因/蛋白序列聚集用横三角表示,并粘贴或输入聚集后的名称标识,点击ok即可(图8)。
图8.树枝聚集与展开转换
在进化树图形界面的右侧有分类优化图标。选中要分类的分枝,再点击工具栏中的Subtree图标即可分类标记序列的共同特征(图9)。同时第4步中设置的数据归类信息也可在图中展示如图9中显示的G3、G4信息(该信息也可以在subtree下拉菜单选项中选择取消显示)。
图9.树枝归类优化
此外,左测还有一些颠换顺序的图标:选中分枝点,点击目的图标,可上下位置颠换。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论