2.9 二级蛋白质数据库:Pfam、CATH、SCOP2

  1. Pfam数据库 是一个蛋白质结构域家族的集合

    Untitled
    • 搜索
    Untitled
    • 输入蛋白质序列
    Untitled
    • 找到四个结构域
    Untitled
    • 查看TIR

      • Summary:获得这个结构域的功能信息及功能注释及结构信息

        Untitled
      • Domain organisation:目前有多少蛋白质拥有TIR结构域以及TIR结构域和其他结构域的组合搭配关系

        Untitled
      • Structures:列出目前所有包含TIR结构域的蛋白质结构,以及他们在序列数据库Uniprot和结构数据库PDB中的链接

        Untitled
  2. CATH 数据库:结构分类数据库

    • Gene3D 里的信息为绝大多数还未解析 3D 结构的蛋白质提供了重要的功能研究依据
    Untitled
    • CATH给每一层的每一种结构分类命名,因此每个结构域会有像黄色那样的分类代码

      第一个数字:C 第二个数字:A 第三个数字:T 第四个数字:H

    Untitled
    • CATH-Gene3D 还为超过 500 万条来自公共数据库的蛋白质序列进行了结构分类预测

      • 输入

        Untitled
      • 结构分类代码是2.70.40.10

        Untitled
      • 可以获得各个层次具体的结构分类信息以及各种结构相关分析信息

        Untitled

        把所有拥有2.70.40.10.10结构分类的结构域根据序列相似度进行了一下聚类,不同深浅的圈代表不同的相似度

        三个黄圆代表3H6X这个结构涉及的三个结构域,因为这个结构有三条量,三条量在序列水平上是完全相同的

        Untitled

      从这个分类里挑出了19个有代表性的结构域,并且把他们的3D结构叠加在了一起,图上可以看到这个分类的总体特征以及差异产生的位置

    Untitled
  3. SCOP2 数据库:结构分类数据库。更多考虑蛋白质的进化关系,分类依赖于人工验证

    SCOP2 分类基于四个层次:从顶部到底部分别为类 (Class)、家族 (Family)、超家族 (Super family) 和折叠 (Fold)

    Untitled Untitled

    分类层次

    Untitled