⽣物信息学python脚本_Python⽣物信息学数据管理
内容简介
html颜代码原理本书实例意在解决⽣物学问题,通过"编程技法”的形式,涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为⽣物研究者设计的编程题⽬,适合教学和⾃学。本书由六部分组成:Python语⾔基本介绍,语⾔所有成分介绍,⾼级编程,数据可视化,⽣物信息通⽤包Biopython,最后给出20个"编程秘笈”,范围涵盖了从⼆级结构预测、多序列⽐对到蛋⽩质三维结构的⼴泛话题。此外,本书附录还包括了⼤量的⽣物信息常⽤资源的信息。
教材特⾊计算机入门自学教程python
该书是⾯向⽣物学读者的编程好书之⼀。随着⾼通量技术(例如DNA微阵列或DNA/RNA测序)的改进,⽣物数据量正在迅速增长。管理和分析⽣物数据的需求越来越多,编程技术的应⽤将成为标准做法。Python由于其功能强⼤,语⾔优雅简单,成为提⾼编程技能的优秀⼯具!本书以Python数据管理为核⼼,主题⼴泛,结构合理,各章相互依赖程度低,便于读者⾃定学习的切⼊点。
作者清晰地诠释了Python在数据管理(解析数据记录、过滤和排序数据)与数据可视化(使⽤Python接⼝R)中的应⽤。本书还提供了模块化编程的描述,引导读者编写简单的函数,通过编写类⽽构建程序流程……⼀切都按照Python编码标准和易于提⾼的⽅式进⾏。
对于⾯临计算挑战的⽣物学家和从业者,本书既适合Python⼊门学习,⼜可助⼒中级Python⽤户学习⼀些新的技巧,进⽽在⾃⼰的代码中实现。书中实例意在解决⽣物学问题,通过“编程技法”的形式,涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为⽣物研究者设计的编程题⽬,适合教学和⾃学。本书由六部分组成:Python语⾔基本介绍,语⾔所有成分介绍,⾼级编程,数据可视化,⽣物信息通⽤包Biopython,以及最后给出的20个“编程秘笈”。“编程秘笈”的范围涵盖了从⼆级结构预测、多序列⽐对到蛋⽩质三维结构的⼴泛话题。此外,本书附录还包括了⼤量的⽣物信息常⽤资源的信息和简单的UNIX教程。
前⾔
在⼏年前, 编程只是计算科学⼯作者的特权。虽然如此, 编程正加速变成⽣物等其他领域专家的⼀种需要。作为⼀个⽣物学研究者, 不需要对成为⼀个编程专家感兴趣, 但是需要把编程作为多个⼯具中的⼀种来继续科学⼯作。可能读者已经意识到编程技巧可以⼤幅地加速管理和分析数据。可能读者需要处理⼤规模的数据, 多次重复某种相同的分析, 或者从⼀个⾮通⽤格式的⽂件中解析数据。可以确信的是,在所有这些情形下, 编程可以帮助你。然⽽, 因为读者从来没有对“枯燥⽆味”和“概念艰深”的计算机科学学科有很⼤兴趣, 就可能会感到不习惯。如果是这样的情况, 这本书是适合你的。
本书是为那些需要更多地掌控数据, 因此需要学习⼀些编程的⽣命科学⼯作者⽽写的。⽬标是使得那些以前没有编程经验的⽣物科学⼯作者能够⾃⼰⽤Python对⽣物数据进⾏分析。
在前⾔中, 包括全书内容的概述及编程介绍, 最后是对Python编程语⾔的概览。
我们希望这本编程书是为⽣物学⼯作者的读者量⾝定制的, 能帮助分析读者的数据, 从⽽尽早有所收获。
译者序
1101 2的原码 反码和补码随着⽣命科学科研领域的需要和测序技术的发展,⽣物信息这个交叉学科近年来愈来愈兴旺起来,从业者也越来越多。与传统的理论和实验学科不同,⽣物信息是⼀门数据科学,这就需要从业者具备⼀定数据收集、管理、处理和分析的能⼒。在海量的组学数据⾯前,使⽤别⼈开发的软件及图形界⾯操作往往不能解决⼯作中的问题,⽽简单的编程就可能解决问题,因⽽编程即成为⼀个⽣物信息⼯作者的必备技能。这本书就是为⽣物信息初学者设计的编程教程。
我从事⽣物信息⼯作以来,编程语⾔开始⼀直以PERL和C为主,从2007年开始使⽤Python,初时也因为块缩进的问题不习惯,但很快被其可读性和开放性所吸引,喜欢上了这门语⾔,并作为最主要的脚本语⾔使⽤⾄今。回国后,发现国内⼤部分的⽣物信息⼯作者还是以PERL作为主要的⼯作语⾔,就想为Python在这个领域的推⼴做些⼯作,有幸得到出版社马岚⽼师的推荐,见到本书,就与陈⼀情,李少娟合作进⾏了翻译。
正如书中所说,编程就像写菜谱做饭或者是按流程做⽣物实验⼀样,不是⼀件很难的事情。对于有过逻辑训练的⽣物研究者只要能熟悉了编程的思想,掌握这项技能是容易的。但是如何选择⼀个切门点和提⾼途径,真正把它运⽤到⾃⼰的⼯作中就是另外⼀件事情,为什么推荐这本Python书作为⽣物信息数据管理编程的⼊门书呢?
Python语⾔提供了从⼊门到⾼⼿的良好的学习曲线。Python语⾔是⾄今为⽌最接近⾃然语⾔的编程语⾔,学过其它⼀些编程语⾔的学员甚⾄不需要太多的训练就能读写其代码;模块化和⾯向对象的⽀持使得学员能不费⼒地从⼀个只能写⼏⾏代码的操作员变成⼀个管理千⾏代码的程序员,同时书写良好可读性代码的编程习惯也会令其受益终⽣;丰富的标准库和第三⽅包使得Python语⾔成为当前最好的“胶⽔语⾔”,把多⽅资源整合到⼀起来解决⼯作中的问题。
本书的风格⾮常适合对编程的初学者。它从⽣物数据管理分析实践出发,由浅⼊深地介绍编程的基础知识,特别是对错误处理和程序调试等初学者常见的问题做了精辟的阐述;本书在内容上对⽣物信息中的经常遇到的数据整理和做图分析有较重的篇幅,还包含了⼤量的Python 第三⽅⼯具库接⼝充分地体现了Python开放性“胶⽔语⾔”的特点。该书采⽤章节的篇幅都不长,每每切中要点,便于读者围绕主题、消化概念,且后⾯的练习难度适中,所以很适合作为本科⽣或是研究⽣低年级的教材;书后的编程秘诀对于进⼊科研实践的研究者也有颇多的参考价值。
⾮常感谢我的博⼠导师陈润⽣院⼠能在百忙中为本书作序。感谢陈⼀情和李绍娟以及所有参与⼯作的同学,陈⼀情翻译本书的第⼀到⼗五章,李绍娟翻译了第⼗六到⼗⼋章,我翻译了其它的部分并校正了本书的译稿。感谢李⼤伟博⼠对蛋⽩质结构翻译部分的意见。⾮常荣幸能得到出版社马岚⽼师的⽀持,才得以出版此书。
希望这本书能对有志于⽣物信息的同道有所帮助。
⽬录
第⼀部分⼊门第1章Python shell
第2章第⼀个Python程序
第⼆部分数 据 管 理第3章分析数据列
第4章解析数据记录
第5章搜索数据
第6章过滤数据
第7章管理表数据
第8章数据排序
第9章模式匹配和⽂本挖掘
第三部分 模块化编程第10章 将程序划分为函数
第11章⽤类化繁为简
第12章调试
第13章使⽤外部模块: R语⾔的Python调⽤接⼝
第14章构建程序流程
第15章编写良好的程序
第四部分数据可视化第16章创建科学图表
第17章使⽤PyMOL创建分⼦图像
第18章处理图像
第五部分Biopython第19章使⽤序列数据
第20章从⽹络资源中检索数据
第21章使⽤三维结构数据
第六部分编 程 秘 笈编程秘笈1: PyCogent库编程秘笈2: 反向互补和随机化序列
编程秘笈3: ⽤概率创建随机序列
编程秘笈4: ⽤Biopython解析多序列联配
编程秘笈5: 从多序列联配中计算共有序列
编程秘笈6: 计算系统发⽣树的节点间的距离
编程秘笈7: 核苷酸序列的密码⼦频率
编程秘笈8: 解析Vienna格式的RNA⼆级结构
编程秘笈9: 解析BLAST的XML输出
编程秘笈10: 解析SBML⽂件
编程秘笈11: 运⾏BLAST
编程秘笈12: 访问、 下载和读取⽹页
编程秘笈13: 解析HTML⽂件
编程秘笈14: 将PDB⽂件分割成PDB链⽂件压力容器标准规范2021
编程秘笈15: 在PDB结构上到两个最靠近的Cα原⼦
编程秘笈16: 提取两个PDB链间的界⾯
编程秘笈17: ⽤Modeller建⽴同源模型
编程秘笈18: ⽤ModeRNA分析RNA三维同源模型
编程秘笈19: 从三级结构计算RNA碱基配对
数据类型强制转换编程秘笈20: 结构重叠的真实实例: 丝氨酸蛋⽩酶催化三分⼦附录附录A命令概览附录BPython资源
附录C记录样板
附录D处理⽬录和⽤UNIX编程
丛书名:⽣命科学与信息技术丛书
著 者:(意)Allegra Via (阿莱格拉 维亚) 等
作 译 者:卢宏超等
数据库filename是什么意思
策划编辑:马岚
出版时间:2017-01
版 次:01-01
I S B N :9787121303821
定价:¥69.00

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。