利用perl鉴定和开发EST-SSR
1、perl 在windows操作系统下的安装:从www.activestate/activeperl/中获得适合不同进制windows版本的activeperl;按照默认安装在C 盘根目录下,文件名为perl,其中包含bin,eg,etc,html,lib,site六个文件,其它perl程序的运行和文件数据的处理都必须存放于C:\perl\bin 目录下。
2、利用NCBI数据库检索系统Entrez 下载EST序列,格式为fasta。
3、利用est_timmer去除EST序列中过短的序列(<100bp)和过长的序列(>700bp)以及mRNA的“帽子”和“尾巴”:从 pgrc.ipk-gatersleben.de/misa/下载est_timmer.pl;运行est_timmer.pl命令为c:\perl\bin>perl est_trimmer.pl A.fasta –amb=2,50 –tr5=T,5,50 –tr3=A,5,50 –cut=100,700,点击回车运行;输出两个文件A.fasta.log和sults。
4、利用CD_HIT快速批量去冗余序列:从/cd-hit/ 中得到CD_HIT;把sults复制到cd_hit文件夹中并重命名为B.fasta,运行,输入命令为:c:\perl\bin\cd_hit> –i B.fasta –o C.fasta –c 1.00 –n 5 –M 2000,输出三个文件,其中C.fsata文件用于下一步处理。
5、利用misa.pl识别和定位SSR:从pgrc.ipk-gatersleben.de/misa/ 下载(包括配置文件misa.ini,用来设置识别SSR标记的标准);复制C.fsata文件到c:\perl\bin目录下,输入命令:c:\perl\bin>perl misa.pl C.fasta,运行后产生C.fasta.misa和C.fasta.statistics两个文件,其中C.fasta.misa用于primer3引物设计。
6、利用primer3模块批量设计SSR引物:
适用于perl的primer3的下载地址
sourceforge/projects/primer3/files/primer3/1.1.4/primer3-1.1.4-WINXP.zip/download;Misa.pl的结果在用于primer模块进行批量引物设计前,需要p3_in.pl创建 Primer3的输入文件,然后才能进入primer3,primer3的运行结果需要p3_out.pl来解析。p3_in.pl和p3_out.pl均可在pgrc.ipk-gatersleben.de/misa/primer3.html 下载;
先运行p3_out.pl,命令为:c:\perl\bin>perl p3_in.pl C.fasta.misa,产生了一个名为C.fasta.p3in的primer3的输入文件;
再复制C.fasta.p3in文件到c:\perl\bin\primer3\bin根目录下,运行实现批量
的引物设计,命令输入格式为:c:\perl\bin\primer3\bin> < C.fasta.p3in > C.fasta.p3out,产生一个名为C.fasta.p3out的文件;
最后是复制C.fasta.p3out文件到c:\perl\bin,运行p3_out.pl,命令为:c:\perl\bin>perl p3_out.pl C.fasta.p3out C.fasta.misa,运行后得到sults文件,以记事本的形式打开,再拷贝Microsoft Excel中。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论