生物信息学学习心得
第一篇:生物信息学
生物信息学是上世纪90年代初人类基因组计划(hgp)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特,推动学校学科建设和本科教学水平。
本实验指导书中的8个实验均设计为综合性开发实验,面向生物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。 实验一 熟悉生物信息学站及其数据的生物学意义
实验目的:
培养学生利用互联资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据件格式和其中重要的生物学意义。
实验原理:
利用互联资源检索相关的国内外生物信息学相关站,如:ncbi、sanger、tigr、kegg、swissport、ensemble、中科院北京基因组研究所、北大生物信息
学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathway等数据,理解其重要的生物学意义。
实验内容:
1. 浏览和搜索至少10个国外和至少5个国内生物信息学相关站,并描
述站特征;
2. 下载各站的代表性数据各10条(组)以上,并说明其生物学意义;
3. 讨论各站适合做何种生物信息学研究的平台,并设计一个研究设想。 实验报告:
1. 各站址及特征描述;
2. 代表性数据的下载和生物学意义的描述;
3. 讨论:这些生物信息学相关站的信息资源,可以被那些生物信息学
研究所利用。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2014;《生物信息学手册》 郝柏林 等著, 上海科技出版社, 2014;
《生物信息学实验指导》 胡松年 等著, 浙江大学出版社, 2014。 实验二 利用blast进行序列比对
实验目的:
了解blast及其子程序的原理和基本参数,熟练地应用络平台和linux计算平台进行本地blast序列比对,熟悉blast结果的格式和内容并能描述其主要意义,同时比较上平台和本地平台的优缺点。
实验原理:
利用实验一下载的核算和蛋白质序列,提交到ncbi或者其他拥有blast运算平台的页上,观察其基本参数设定库件类型,并得到计算结果;同时在本地服务器上学会用formatdb格式化库件,并输入blast命令进行计算,获得结果件。
实验内容:
1. 向上blast服务器提交序列,得到匹配结果;
2. 本地使用blast,格式化库件,输入命令行得到匹配结果;
3. 对结果件进行简要描述,阐述生物学意义。
实验报告:
1. 阐述blast原理和比对步骤;
2. 不同类型blast的结果及其说明;
3. 讨论:不同平台运行blast的需求比较。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2014;
《生物信息学实验指导》 胡松年 等著, 浙江大学出版社, 2014;。
实验三 利用clustalx(w)进行
多序列联配
实验目的:
掌握用clustal x(w)工具及其基本参数,对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析,由此对这些物种的亲缘关系进行判断,并且对这些序列在分子进化过程中的保守性做出估计。
实验原理:
首先对于输入的每一条序列,两两之间进行联配,总共进行n*(n-1)/2次联配,这一步通过一种快速的近似算法实现,其得分用来计算指导树,系统树图能用于指导后面进行的多序列联配的过程。系统树图是通过upgma方法计算的。在系统树图绘制完以后,输入的所有序列按照得分高低被分成n-1个组,然后再对组与组之间进行联配,这一步用myers和miller算法实现。
实验内容:
1. 明确软件所支持的输入件格式,搜集整理出合适的数据;
2. 在windows环境运行clustal x,在linux环境运行clustal w;
3. 实验结果及分析,用treev32或njplotwin95生成nj聚类图。
实验报告:
1. 整理的符合clustal的序列数据;
2. 提交数据页记录和各步骤记录;
3. 提供聚类图和多序列联配图,并说明意义。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2014;
《生物信息学实验指导》 胡松年 等著, 浙江大学出版社, 2014。 实验四 ests分析
实验目的:
熟悉使用一系列生物信息学分析工具对测序得到ests序列数据进行聚类处理,由此对获得表达基因的丰度等相关信息,并且对这些表达基因进行功能的初步诠释,为后续实验通过设计race引物获得全长基因,以及进一步的功能注
释和代谢途径分析做准备。
实验原理:
首先用crossmatch程序去除ests原始序列中的载体成分和引物成分,然后用phrap生成congtig和singlet,用blast程序进一步将有同源性的contig和singlet进行功能聚类,最后通过blast对聚类获得的cluster进行功能注释。在实验过程中将用到一些本实验室写的perl程序用于连接各数据库和工具软件。
实验内容:
1. 运行codoncode aligner程序,并用它建立工程件,导入例子件
夹里面的数据;练习对序列的各种查看方式。
2. 使用codoncode aligner程序里的clip ends, trim vector, assemble
等功能,完成序列的剪切、去杂质、组装。
实验报告:
1. 实验各步骤记录和中间结果件;
2. 举例简要说明结果件中数据的生物学意义。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2014;
《基因表达序列标签(est)数据分析手册》 胡松年 等著, 浙江大学出版社, 2014。
实验五 利用primer premier5.0设计
race引物
实验目的:
熟悉pcr引物设计工具primer premier5.0的一些基本功能,能够根据实验需要选择相应的引物设计方法设计pcr引物。
实验原理:
pcr实验是当代分子生物学的基本实验之一,由于目标序列和实验目的的不同,相应设计引物的要求也不一样。本实验延续ests分析结果,对于其中需要获得全长的基因进行race引物的设计,及5’和3’race引物,配合接头序列设计单向引物,并模拟练习通过连接获得全长的基因cds序列。最后设计已知全长基因序列的pcr扩增引物。
实验内容:
1. 从站下载并安装primer premier5.0;
2. 从 genbank 中任意获取一个 dna 序列,设计出该序列的合适引物; 实验报告:
1. 实验各步骤使用的数据、运算平台、结果件记录;
2. 比较不同引物设计平台和不同pcr实验的差别;perl语言学习
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2014;《生物信息学实验指导》 胡松年 等著, 浙江大学出版社, 2014; 。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论