2.9 Secondary Protein Database
2.9 二级蛋白质数据库:Pfam、CATH、SCOP2
-
Pfam数据库 是一个蛋白质结构域家族的集合
- 搜索
- 输入蛋白质序列
- 找到四个结构域
-
查看TIR
-
Summary:获得这个结构域的功能信息及功能注释及结构信息
-
Domain organisation:目前有多少蛋白质拥有TIR结构域以及TIR结构域和其他结构域的组合搭配关系
-
Structures:列出目前所有包含TIR结构域的蛋白质结构,以及他们在序列数据库Uniprot和结构数据库PDB中的链接
-
-
CATH 数据库:结构分类数据库
- Gene3D 里的信息为绝大多数还未解析 3D 结构的蛋白质提供了重要的功能研究依据
-
CATH给每一层的每一种结构分类命名,因此每个结构域会有像黄色那样的分类代码
第一个数字:C 第二个数字:A 第三个数字:T 第四个数字:H
-
CATH-Gene3D 还为超过 500 万条来自公共数据库的蛋白质序列进行了结构分类预测
-
输入
-
结构分类代码是2.70.40.10
-
可以获得各个层次具体的结构分类信息以及各种结构相关分析信息
把所有拥有2.70.40.10.10结构分类的结构域根据序列相似度进行了一下聚类,不同深浅的圈代表不同的相似度
三个黄圆代表3H6X这个结构涉及的三个结构域,因为这个结构有三条量,三条量在序列水平上是完全相同的
从这个分类里挑出了19个有代表性的结构域,并且把他们的3D结构叠加在了一起,图上可以看到这个分类的总体特征以及差异产生的位置
-
-
SCOP2 数据库:结构分类数据库。更多考虑蛋白质的进化关系,分类依赖于人工验证
SCOP2 分类基于四个层次:从顶部到底部分别为类 (Class)、家族 (Family)、超家族 (Super family) 和折叠 (Fold)
分类层次
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 梁止潆的博客!
评论