📜  生物信息学中生物数据库的类型

📅  最后修改于: 2021-09-09 11:14:36             🧑  作者: Mango

生物数据库

  • 这些是由生物数据(如蛋白质测序、分子结构、DNA 序列等)以有组织的形式组成的数据库。
  • 有几种计算机工具可以操作生物数据,如更新、删除、插入等。来自世界各地的科学家和研究人员将他们的实验数据和结果输入到生物数据库中,以便更广泛的受众可以使用这些数据。
  • 生物数据库可以免费使用,并包含大量各种生物数据。

生物数据库的用途:

  • 它帮助研究人员研究现有数据并形成新的论文,抗病毒、有益菌、药物等。
  • 它帮助科学家理解生物现象的概念。
  • 数据库充当信息的存储。
  • 它有助于消除数据的冗余。

生物数据库的类型:

基本上有3种类型的生物数据库如下。

1. 主数据库:

  • 它也可以称为档案数据库,因为它存档了科学家提交的实验结果。主数据库填充了实验派生的数据,如基因组序列、大分子结构等。此处输入的数据仍未经过整理(未对数据进行任何修改)。
  • 它获得从实验室获得的独特数据,这些数据可供普通用户访问,无需任何更改。
  • 数据在输入数据库时被赋予登录号。以后可以使用登录号检索相同的数据。登录号唯一地标识每个数据并且它永远不会改变。

例子 –

  • 主要数据库 – 核酸数据库的示例是 GenBank 和 DDBJ
  • 蛋白质数据库有 PDB、SwissProt、PIR、TrEMBL、Metacyc 等。

2. 二级数据库:

  • 这些类型数据库中存储的数据是主数据库的分析结果。计算算法应用于主数据库,有意义和信息丰富的数据存储在辅助数据库中。
  • 这里的数据是高度策划的(在数据出现在数据库中之前对其进行处理)。与主数据库相比,二级数据库更好,包含更多有价值的知识。

例子 –

辅助数据库的示例如下。

  • InterPro(蛋白质家族、基序和域)
  • UniProt 知识库(蛋白质的序列和功能信息)

3. 复合数据库:

  • 在这些类型的数据库中输入的数据首先进行比较,然后根据所需的标准进行过滤。
  • 初始数据取自主数据库,然后根据特定条件将它们合并在一起。
  • 它有助于快速搜索序列。复合数据库包含非冗余数据。

例子 –

复合数据库的示例如下。

  • 复合数据库 -OWL、NRD 和 Swissport +TREMBL