随着计算机技术和Internet数字化高速公路日新月异的飞速发展,生物信息(Bioinformation)和生物电脑化(Biocomputing)也飞速发展,愈来愈多的生物学家(Bioscientist)根据生物科学(Biosience)研究的实际需要,编写了大量的生物科学应用软件。生物科学软件应用范围非常广泛,从最基本的多媒体互动式教学到最高级的虚拟细胞生命过程的互动式模拟,可谓应有尽有[1,2,3]。这些软件的实际应用,为医学进一步信息数字化、信息全球共享化带来了光明的前景。而分子生物学作为生命科学一个极为重要的分枝,理所当然倍受重视,其相应的生物科学应用软件可谓枚不胜举[2,3,4]。分子生物学专业软件(Molecular Biology Software;Biosoft)的应用,为广大分子生物学研究人员的医、教、研工作带来了极大的便利性。
与普通的应用软件相同,分子生物学专业软件的种类主要有纯商业软件(只提供软件功能演示)、商业共享演示软件(全部或部分软件功能但使用时间极为有限)和免费软件[2]。对于前两种软件而言,只有付出一定的费用,才会得到全功能的商业软件,而后者却完全免费使用。对于大多数资金有限的从事分子生物学研究的教师、工作人员和学生等,免费软件通常是唯一的选择。因此,本文着重介绍在PC机WINDOWS95/98和Mac机OS操作系统上应用的分子生物学免费软件及其重要性,并指出在何处可以到自己所需的免费软件以及在论文写作和发表中如何处理免费软件应用的相关问题。
一.分子生物学专业软件在分子生物学领域应用的重要性
在分子生物学研究领域中,引物设计、多序列比较分析、基因进化树结构分析、核酸/蛋白质高级结构预测等等,若单纯依靠手工设计与分析,几乎很难达到理想要求。而通过使用分子生物学专业软件,则可以很轻松地设计出符合要求的引物、简便快速地进行多序列的分析比较等。不仅如此,它还可制作具有专业水平的图形图像,如质粒图谱、克隆表达载体构建图谱、限制性酶切片段图谱等。分子生物学专业软件应用可以比较方便地解决分子生物研究人员从立项到最后写论文的实际问题,它在分子生物学的应用范围主要有:研究资料收集整理(如序列查询、文献检索)、序列分析和实验设计(如引物设计、限制性酶切分析、同源序列比较、质粒作图、基序查、RNA二级结构预测、蛋白二级结构预测、克隆策略图谱、蛋白三级结构显示、序列格式转换、DNA 测序样品原始胶图文件分析等)、实验数据统计和分析(如电泳条带定量分析、数据统计分析作图)、论文写作和发表(如文献引用、生成发表质量的图片、序列递交)。
二、分子生物学免费软件的索取与应用
从国际互联网Internet中可以发现并收集到大量分子生物学医、教、研免费软件。其中,大部分应用软件均由生物学家、化学家和软件开发者所写。
2.1免费软件与商业软件
当分子生物学家的科研需要一类新的分析演算法则时,就将其具体化成软件,如大部分免费的基本分子
生物学序列分析软件包均是由生物科学家开发的,包括FastA、BLAST、Clustal、MFOLD、PHYLIP、Paup、CAP等。通常此类软件的源代码属于免费共享。与商业软件相比,免费软件往往在用户界面、易用性及集成性方面稍逊一畴,而且,商业软件包在软件的升级支持、技术支持等方面也有一定的优势。因此,在资金许可的情况下,商业软件通常是一种更好的选择。但免费软件的最大优势就在于它为广大从事分子生物学研究的相关人员提供了专业性相关最好的软件资源,甚至某此免费软件提供的功能比商业软件更强大,或者还提供了商业软件未能提供的功能。
此外,随着生物信息和生物电脑化的飞速发展,许多优秀的程序员都正在开发软件,其中许多人将此类软件作为一种免费软件。现在,许多免费软件都特别注重用户界面、易用性及集成性。对于大部分科学应用软件,由于其潜在的市场非常小,以致于有时免费软件包与昂贵的商业软件包在功能上没有明显的差别。
2.2Internet资源——分子生物学免费软件资源点
自从80年代开始,生物科学免费软件已经可以广泛地通过Internet获得。现在有许多专用于存放生物科学免费软件及其相应资料的档案文件库(Archives),而且,还有许多免费软件作者自己提供的网络服务器,从这些站点上,可以最大限度地收集到各种用途的分子生物学免费软件。
目前,存放分子生物学软件最常用的两个档案库是印地安那州大学的IUBio档案文件库(IUBio)和欧洲
生物情报协会(European Bioinformatics Institute,EBI)软件档案文件库,其统一资源定位器(RUL)地址分别是iubio.bio.indiana.edu/或ftp://iubio.bio.indiana.edu/(IUBio)和www.ebi.ac.uk/或ftp://ftp.ebi.ac.uk/(EBI)。
通过EBI可以连接到EMBL数据库及其它数据库的主页及许多分子生物学软件档案库主页,如生物软件目录表(Bio Catalog of software,www.ebi.ac.uk/biocat/biocat.html)。
IUBio也与许多生物软件主页相连,并提供对GenBank、SwissPort和PIR数据库关键字查询及生物网络新闻档案库服务(Bionet Network News Archives)。IUBio在世界各地有许多镜像站点,包括芬兰、瑞典、日本、英国、法国、西班牙、以列等。
除上述两个主要的档案库外,还有许多类似的分子生物学免费软件档案库,如kiwi.du:8088/search-launcher/launcher.html、bi.v/、expasy.hcuge.ch/。
2.3查询与索取软件技巧
在知道软件名称及网址时,可直接方便地从网上下载相应的软件。但当不知道软件网址或仅仅想了解大部分软件时,就可以通过Internet上的各类搜索引擎进行查询,如Google(le)、Y
ahoo(www.yahoo/)、网易(www.163)、Altavista(www.altavista.digital/)等,此时,以软件名称进行特定的搜索查询,或以其它关键词,如molecular biological software进行广泛的搜索,即可查询到相关软件网址。
索取软件的方式通常有以下几种。首先可在软件所在网站直接下载:如Netscape、Internet Explore及其它网页浏览器均可通过HTTP (超级文本传输协议)或FTP(文件传输协议)下载软件。其次,某些软件还可通过Internet网站向用户以软盘或光盘形式免费提供商业软件演示版本软件包,此外,某些免费软件还可向软件作者直接以的形式索取。
要牢记一点的就是软件是不断升级的,如果使用软件版本有问题的话,也许现在或很快就有新的版本。软件作者的主站点是检查软件是否升级的最好的地方,而档案服务器并不总贮存有软件的最新当前版本。
2.4安装和使用
通常,免费软件含有安装说明,但并不总是很详细,或不能涉及软件运行时涉及的所有问题。软件的特殊安装一般只有商业软件才会有,一般而言免费软件是不需要特殊安装的。对于部分特殊软件,特别是用Java或Perl语言写的软件,常会要求您还要安装其它免费的常用软件后才能使用,因此,一定要首先详细地阅读免费软件的安装说明。
2.5多平台软件
以1998年的统计而言,在当年访问IUBio及其它生物网络服务器的INTERNET浏览器中,30-50%的生物学家使用Mac计算机,40-70%使用Wintel系统(Microsoft和Intel的联合),少于10%使用XWindows系统作为工作平台。生物科学家对计算机系统及软件的保持不同,根据软件的运行环境,许多已经使用或将要使用多平台操作系统。在今后,有可能Mac上运行MS Windows软件运行,而在Wintel系统运行一些Mac OS程序。
近年出现的Java语言使得开发跨平台的多种操作系统的软件成为可能,从而使一应用软件可在任何一台计算机上被任何需要它的人所使用,这无疑是软件应用的一种理想境界。诞生于Sun Microsystems(www.javasoft)的Java开发系统虽然与C++、C语言及其它语言所开发的程序相比,Java软件的运行速度还比较慢,但有望开发出多平台操作系统中运行流畅的应用软件。在今后,将会有许多用Java语言开发的生物科学软件,例如来自于Licor的序列分析软件包(www.licor)。
2.6客户端服务器软件
许多生命科学软件开发者的观念是将用户界面从分析应用程序中分离出来,从而增强应用程序的易用性。这一观念构成了软件客户端服务器软件的理论基础,如目前可以进行多种数据分析的网页界面的应用程序(如SeqPup)。
SeqPup功能及原理如下:它充许用户使用任何自己需要的分析软件,如Clustal、CAP、tacg、fastDNAml或别的软件,在客户端计算机或服务器计算机上运行。SeqPup提供了序列编辑、多序列比较、序列输入输出选项等功能。并可配置如上所述分析软件。这些分析应用程序通常没有命令行选项,但可对复杂的数据进行编辑和分析。有了如SeqPup的客户端应用程序后,使用这些软件就比较简单,并可按照自己的方法组织和管理自己的数据。
由Peter Rice开发的一套免费分子生物学分析应用软件EMBOSS(www.sanger.ac.uk/Software/EMBOSS/)将运行于UNIX服务器计算机,有命令行界面。EMBOSS将包括多种序列分析项目,而且力求提供与其它公众域(Public Domain,用户可以免费获得公众域的服务或文件)软件包集成的简便性。分析功能包括快速的数据库序列搜索、小片段基因组密码子作用分析、微生物基因序列识别、多序列的快速鉴别、蛋白基序识别、发表论文的出版工具等。
三.优秀免费软件举例
3.1Clustal:多序列比较(sequence alignment)
Clustal是一类多序列比较软件,目前最新版本叫Clustal W,可以应用于MacOS、Wintel、UNIX和VMS计算机。对多个核酸或蛋白序列的比较目前是分子生物学中一类很有用的分析工具,可用于寻特征化蛋白家族的诊断模式、预测新序列的二级/三级结构、设计PCR引物,以及分析分子演变进程。Clustal可
在EBI和IUBio的档案库ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW中下载。此软件的商业版本称之为ClustalX,它提供了一种图形界面,但功能相似。
3.2Entrez:基因组序列搜索引擎及MEDLINE检索工具
Entrez是可通过关键字搜索基因序列和检索MEDLINE文献的多平台操作系统软件,由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)的成员开发,可以从ncbi.v/或ftp://ncbi.v/下载。Entrez的优点之一就是它包含了对MEDLINE的查询,从而可以检索向序列数据库递交的文献摘要。NCBI的万维网(WWW)服务还提供了可以通
过用户网页浏览器进行搜索的另一类型的Entrez。NCBI开发的Entrez应用程序源代码为其它生物科学应用程序提供了一个软件框架,如SeqPup、Clustal-X等。
3.3NIH Image:图像分析
NIH Image是由Wayne Rasband编写的Mac图像分析应用程序,可对图像面积、平均密度、重心及用户定义的多边形区域的分析,自动进行点的分析、测定路径长度和角度。该软件可在ftp://zippy.v/pub/nih-image/、rsb.v/nih-image/处下载。目前,已提供了针对MS Windows的新版本,可从www.scioncorp/处下载。
3.4PHYLIP:系统发生分析
PHYLIP是由Joseph Felsenstein开发的多平台操作系统常用系统发生推论软件(Phylogeny Inference Package),具有DNA和蛋白序列分析、限制性酶切位点分析、距离矩阵和基因频率、进化树绘制,可以通过许多选项精确控制分析过程。PHYLIP的下载网址为ics.washington.edu/或ftp://ics.washington.edu/。
3.5RasMol:分子模型浏览
RasMol是一类可以浏览蛋白、核酸和小分子物质的多平台操作系统常用分子图形观察器。此类软件的目的是显示、教学和制作出版质量的图像。RasMol以交互式界面、多种颜和外形显示分子,并可对分子外框架线条的颜与粗细、分子空间填充物球形、棒状、实心或空心等进行选择。RasMol下载的主站点是ftp://ftp.dcs.ed.ac.uk/pub/rasmol/。
3.6SeqPup:序列编辑
SeqPup是由Don Gilbert用Java语言开发的多平台操作系统序列编辑和分析软件,其前身称SeqApp,其优势在于可外挂网络服务器及其它序列分析应用程序,如ClustalW、CAP、tacg、fastDNAml及其它相应软件,功能包括多序列的比较和单序列的编辑、读写多种序列文件格式、序列特征编辑等,可在ftp://iubio.bio.indiana.edu/molbio/seqpup/下载。
四.免费软件实际应用相关问题
4.1公众域版权问题
大部分免费软件的版权属于作者或赞助商。他们只是给你免费使用软件的权利,可能只是一种非商业性使用。使用商业软件或其它付款方式使用的软件,则取得作者认可的版权的使用。许多免费软件都一起提供了源代码,因此用户可以修改并进一步开发它。这对于富有经验的用户做自己所需的分析带来的极大的便利性,但必需注意商业软件包是不充许的。如果作者将其作品放在公众域,并不保留任何控制,那么软件就可以用于商业用途。
4.2软件出版索引
若在一项研究中应用了免费软件,则研究论文的发表将涉及到免费软件出版索引问题,正如引用了某篇参考文献一样。那么,如何使用索引呢?一些免费软件有公司出版的相关文章直接引用,而另一些则没有。因此对于后者若在杂志/卷号部分引用软件的Internet URL地址将是非常有用的。就目前Internet的使用情况而言,一般大部分软件可在10年或更长的时间位于Internet的同一个URL地址。因此,保留URL地址对于文献查阅者是非常有用的。下面,是索引的两个例子:
Felsenstein,J.1993.PHYLIP(Phylogeny Inference Package)version 3.5c.Distributed by the author at ftp://ics.washington.edu/.Department of Genetics,University of Washington,Seattle.
Gilbert, D.G.,1996.SeqPup,biosequence editor&analysis platform,version0.6.Bionet.Software,July1996. <news://4rb7hr$6rc@usenet.ucs.indiana.edu>See also ftp://iubio.bio.indiana.edu/molbio/seqpup/免费资源网站源码下载
4.3向免费软件作者表达谢意
出于对生物科学免费软件的尊敬与感谢,当研究者能够在发表的研究论文末对相应的免费软件作者表达一份谢意,则一方面承认了免费软件在研究中的作用,另一方面可激励软件作者进一步开发软件的相关功能,有利于软件的进一步完善。此外,还可到Internet 上专用的一此档案文件库所在地对作者表达自己的感谢,如以前80年代其主站点在Intelligenetics的GenBank就曾有一个免费分子生物学软件的档案文件库。
五.结束语
分子生物学应用软件随着分子生物学研究技术的不断发展和Internet网络资源的不断普及,正以前所未有的速度飞速发展,应用于分子生物学研究领域的软件不断由分子生物学研究及相关人员开发。这些专业性应用软件已经成为分子生物学研究的一类有力的辅助工具,极大地方便了分子生物学研究。相信随着分子生物学、计算机及Internet的进一步发展,分子生物学专业性应用软件将具有更广阔、更有价值的应用前景。
参考文献:
1.Peruski L.F.and Peruski A.H,1997.The Internet and the New Biology:Tools for Genomic and Molecular Research;Library of Congress Cataloging-in-Publication Data,American Society for Microbiology1325Massachusetts Ave.,NW Washington,DC.
2.Don Gilbert,Free Software in Molecular Biology for Macintosh and MS Windows computers (iubio.bio.indiana.edu/soft/molbio/Listings.html),June1998,Biology Department Indiana University,Bloomington,IN47405
/AboutSnarkware.html),Last updated13March1999,University of Washington
3.Eli Meir,Who is SnarkWare/BeakerWare(www.snarkware
4.Hoyoyo,生物化学分子生物学软件下载区-分子生物一线实验人员软件解决方案,1999,生物化学分子生物学软件下载区(ase/~hoyoyo/index.htm)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论