📌 相关文章

📜 Biopython简介

📅 最后修改于: 2022-05-13 01:55:24.379000 🧑 作者: Mango

Biopython简介

Biopython是最流行的分子生物学计算包。 Brad Chapman 和 Jeff Chang 于 1999 年开发了它。它主要是用Python编写的，但也有一些 C 代码来解决复杂的优化问题。 Biopython有很多能力，就像它可以做蛋白质结构、序列基序、序列比对以及机器学习一样。

Biopython有很多库可以帮助生物学家的工作，因为它便携、简单、清晰。在某些情况下，Google 图像使用Biopython 、 BioPerl 、 BioJAVA 、 BioRuby是Biopython项目的兄弟。

发展原因

为复杂的生物信息学问题创建高质量、可重用的类。
阅读Swissport 、 FASTA等遗传数据库。阅读后，它将它们解析为Python可利用的数据结构。
用于基因组数据分析。
蛋白质结构工具和BigSQL - 存储大量数据。

好处

良好的读写树视图文件。
支持用于聚类的微阵列数据类型。
将生物信息学文件解析为形式化对象或通用类。

示例案例和功能

RNA 结构： RNA 是我们日常生活中的主要大分子之一，其他是 DNA 和蛋白质。 DNA被称为细胞的蓝图，而RNA在细胞中充当“DNA影印”。为了使这个结构工作变得容易， Biopython有用于 DNA、RNA 块表示的 Bio.sequence 对象。
基因组图：此模块提供 PDF 或 JPG 格式的序列可视化。使用此模块可以进行多序列比较。
SeqRecord： Bio.sequence 只提供序列。 SeqRecord类提供名称、描述、特征以及序列。
群体遗传学：它是检查群体遗传变异的研究。它适用于基因的检查和建模。 Bio.PopGen模块是为了简化工作。
系统发育：正如我之前提到的， Biopython具有使用树视图文件的优势。它使用生物。 Phylo模块可视化树以及从Newick PhyloXML文件格式中获取输入的操作和遍历。