📜  Biopython简介

📅  最后修改于: 2022-05-13 01:55:24.379000             🧑  作者: Mango

Biopython简介

Biopython是最流行的分子生物学计算包。 Brad Chapman 和 Jeff Chang 于 1999 年开发了它。它主要是用Python编写的,但也有一些 C 代码来解决复杂的优化问题。 Biopython有很多能力,就像它可以做蛋白质结构、序列基序、序列比对以及机器学习一样。

Biopython有很多库可以帮助生物学家的工作,因为它便携、简单、清晰。在某些情况下,Google 图像使用BiopythonBioPerlBioJAVABioRubyBiopython项目的兄弟。

发展原因

  • 为复杂的生物信息学问题创建高质量、可重用的类。
  • 阅读SwissportFASTA等遗传数据库。阅读后,它将它们解析为Python可利用的数据结构。
  • 用于基因组数据分析。
  • 蛋白质结构工具和BigSQL - 存储大量数据。

好处

  • 良好的读写树视图文件。
  • 支持用于聚类的微阵列数据类型。
  • 将生物信息学文件解析为形式化对象或通用类。

示例案例和功能

  • RNA 结构: RNA 是我们日常生活中的主要大分子之一,其他是 DNA 和蛋白质。 DNA被称为细胞的蓝图,而RNA在细胞中充当“DNA影印”。为了使这个结构工作变得容易, Biopython有用于 DNA、RNA 块表示的 Bio.sequence 对象。
  • 基因组图:此模块提供 PDF 或 JPG 格式的序列可视化。使用此模块可以进行多序列比较。
  • SeqRecord: Bio.sequence 只提供序列。 SeqRecord类提供名称、描述、特征以及序列。
  • 群体遗传学:它是检查群体遗传变异的研究。它适用于基因的检查和建模。 Bio.PopGen模块是为了简化工作。
  • 系统发育:正如我之前提到的, Biopython具有使用树视图文件的优势。它使用生物。 Phylo模块可视化树以及从Newick PhyloXML文件格式中获取输入的操作和遍历。