Biopython是Python的最大,最受欢迎的生物信息学软件包。它包含许多用于常规生物信息学任务的不同子模块。它由Chapman和Chang开发,主要使用Python编写。它还包含C代码,以优化软件的复杂计算部分。它可以在Windows,Linux,Mac OS X等操作系统上运行。
基本上,Biopython是python模块的集合,这些模块提供处理DNA,RNA和蛋白质序列操作的功能,例如DNA字符串的反向互补,寻找蛋白质序列中的基序等。它提供了很多解析器,可以读取所有主要的遗传数据库 如GenBank,SwissPort,FASTA等,以及在python环境中运行其他流行的生物信息学软件/工具(如NCBI BLASTN,Entrez等)的包装程序/接口。它具有兄弟项目,例如:BioPerl,BioJava和BioRuby。
Biopython是可移植的,清晰的并且具有易于学习的语法。下面列出了一些突出的功能 -
Biopython的目标是通过python语言提供对生物信息学的简单,标准和广泛的访问。下面列出了Biopython的特定目标 -
Biopython只需很少的代码,并具有以下优点 -
Tree-View
类型的文件。让我们来看看一些用例(种群遗传学,RNA结构等),并尝试了解Biopython在该领域如何发挥重要作用:
人口遗传学
种群遗传学是对种群内遗传变异的研究,涉及对种群中基因和等位基因频率随时间和空间变化的检查和建模。
Biopython提供了用于种群遗传学的Bio.PopGen
模块。该模块包含收集经典种群遗传学信息的所有必要功能。
RNA结构
DNA,RNA和蛋白质是我们生活中必不可少的三个主要生物大分子。蛋白质是细胞的主力军,并作为酶发挥重要作用。DNA(脱氧核糖核酸)被认为是细胞的“蓝图”。它携带了细胞生长,吸收营养和繁殖所需的所有遗传信息。RNA(核糖核酸)在细胞中充当“ DNA影印件”。
Biopython提供了Bio.Sequence
对象,这些对象代表核苷酸,DNA和RNA的构建基块。