在蛋白质组学研究中,通过对细胞、组织或器官的蛋白质分析鉴定明确蛋白质在不同物种中发挥的功能以及蛋白质间的相互作用关系。而当你仅仅知道一个蛋白质名称的时候,如何才能知道这个蛋白质存在于什么物种的、什么细胞内、它的作用是什么、结构是什么、以及与它有相互作用的蛋白质是哪些?
今天就让我们用一个蛋白打开uniprot的大门,通过Uniprot数据库来剖析一个蛋白吧!
uniprot数据库
uniprot(TheUniversalProteinResource)蛋白质数据库是一个整合了EBI(EuropeanBioinformaticsInstitute),SIB(theSwissInstituteofBioinformatics),PIR(ProteinInformationResource)三大数据库的资源。目前国际上序列数据较完整、注释信息较丰富的蛋白质序列数据库。
以蛋白HLA-A为例,可以通过uniprot数据库查询该蛋白的具体信息,具体步骤为:
在搜索框内输入蛋白名,点击Search得出的界面如下(图1):
图1
蛋白HLA-A搜索结果
1、为搜索框,可用关键词进行检索,点击搜索框左侧可选取所需的搜寻范围和侧重的搜寻结果。
2、表示序列类型,Swiss-Prot是经过人工注释、审核过的序列,TrEMBL是由核苷酸数据库注释为蛋白质编码区的序列自动翻译而成,未经人工审核。
3、表示筛选条件,可根据物种、关键词等筛选蛋白。
4、为搜寻结果,这一部分可选择自己需要进行编辑保存,之后所选内容便会在搜索结果界面显示(如图2)。
图2
搜寻结果显示内容设置界面
图3
BLAST方法
也可将查询到的序列下载到本地,可选择不同的数据类型(图4):
图4
搜索结果下载方法
对蛋白的详细分析
图5
蛋白P详细内容页
1、该蛋白的基础信息,具体包括该蛋白的登记信息(蛋白名、基因名、物种、是否经过人工审核、蛋白质相关信息质量评分等)、出版发表的文章信息等。
2、蛋白信息对应的条目名称,可以根据需求选择。
3、条目的详细内容,点击条目名称则会出现对该部分内容的解释(图6):
图6
以“Function”为例的条目内容解释
研究目的不同便会注重不同的条目,在这里我们重点解释以下几个部分:
1、Function部分描述该蛋白在物种内发挥的功能、活性位点以及其GO三大层面——分子功能(MolecularFunction,MF)、细胞组分(CellularComponent,CC)、生物过程(BiologicalProcess,BP)的功能等,这一部分主要是生物学知识(图7)。
图7
Function部分具体内容
2、NamesTaxonomy部分提供蛋白名、基因名、NCBI物种分类编码及分类谱系以及该蛋白在其他数据库的ID(图8)。
图8
蛋白HLA-A搜索结果
3、Subcellularlocation可了解该蛋白的亚细胞定位,附带亚细胞结构图,注释该蛋白存在的位置以及GO注释信息(图9)。
图9
Subcellularlocation部分具体内容
4、PathologyBiotech提供与该蛋白质相关的疾病和表型信息,包括与遗传变异相关的疾病信息、发生变异的位点等(图10)。
图10
PathologyBiotech部分具体内容
5、PTM/Processing这部分内容针对蛋白的氨基酸序列,分析翻译后修饰特征。展现在不同位点的转录后修饰及加工信息,提供了信号肽、二硫键、磷酸化位点等信息。除此之外还提供了其他蛋白质组数据库的链接,可查看质谱实验的结果(图11)。
图11
PTM/Processing部分具体内容
6、Interaction提供有关蛋白质四级结构以及与其他蛋白质或蛋白质复合物相互作用的信息,其中详细描述该蛋白与其他蛋白如何发生作用?在这一部分可