首页 > 科研教程 > 【技术分享】 UniProt 数据库使用指南
2021
08-25

【技术分享】 UniProt 数据库使用指南

在这个信息大爆炸的年代,浩瀚的信息流如同汪洋大海一般,将每个人都紧紧环绕。如何利用已有的工具从中筛选有用信息,对我们每个人,尤其是科研人而言,尤为重要。在免疫学,医学,药学科研和工作中,我们常常会用到蛋白数据库,关于蛋白质的结构,蛋白质质谱等数据库均较多,今天给大家分享讲讲使用频率最高且冗余度最低的uniprot数据库。希望能对你们有所帮助~

下面,菲小恩以研究得比较多的 IL-6为例,分享如何有机结合数据库和产品信息。

一、查找

用浏览器打开 https://www.uniprot.org/ 页面,输入关键词 IL-6,点击右上方的 Search 按钮,然后找到需要研究的物种,就会出现该蛋白的详细信息。

二、 详细信息界面

首先介绍的是 “Function”详细信息界面 ,该板块会罗列出蛋白的基本功能及参与的生物学过程。每句介绍后的链接即是相应的参考文献,有需要可点击查阅。

三、“Names & Taxonomy” 板块

随后的 “Names & Taxonomy” 板块展示的是命名和来源种属信息、NCBI 和 Enzembl 的基因数据库链接,可直接点击查阅。NCBI 和 Enzembl 数据库也可查询。

四、表达谱和定位

之后便是与实验密切相关的重要信息:蛋白的组织细胞表达谱和亚细胞定位。

我们在进行 IHC、IF 实验时,常常会遇到一个重要而棘手的问题:我看到的阳性信号是不是特异的?UniProt 就可以给予一定的支持信息,在 “Expression” 板块,阐述多细胞生物中,基因(mRNA 水平/蛋白水平)在细胞/组织中的表达情况;在 “Subcellular location” 板块,包含成熟蛋白在细胞中的定位和拓扑结构信息。

综合以上信息,我们不难发现,IL-6在体内是普遍存在的,在脂肪和淋巴组织中会更高。它的亚细胞定位是内质网,细胞膜和分泌表达,那么 IHC 的阳性信号主要是细胞间隙,以及细胞外围一圈和细胞内的核周围。

IHC 实验数据,可以明显看到 IL-6的表达位置

(左)人扁桃体,菲恩生物对应抗体货号:FNab04282

(右)宫颈癌组织,菲恩生物对应抗体货号:FNab04283

五、蛋白的拓扑结构

了解完亚细胞定位之后,该说说蛋白的拓扑结构了。“Subcellular location” 的 “Topology” 部分详细列出 IL-6为 的胞外区、跨膜区和胞内区位置,以及它们相对应的氨基酸序列。可不要小看这些信息,它们都是挑选蛋白类产品的重要线索。

序列范围

菲恩的 IL-6为 重组蛋白产品会标明其序列范围,以下图为例(菲恩生物货号P0174),该蛋白的序列范围是29-212aa,结合 UniProt 上的序列及结构信息,可知该重组蛋白序列覆盖 IL-6为 的整个胞外区。因而,可以结合自身实验需要挑选合适的蛋白产品。

在 “PTM/Processing” 部分,UniProt 数据库会列举蛋白合成过程中的分子加工、氨基酸修饰及翻译后修饰,比如剪切、糖基化、脂酰化、二硫键位置等等。

这些信息对实际实验有什么提示作用呢?

在 “Sequences” 板块,同时标注了 IL-6为 各个转录本表达蛋白的基础分子量。以序列最长的转录本为例,Mass (Da) 信息表明,该蛋白的基础分子量约为 24KD。

但有时实际组织中,某些蛋白的 WB 阳性条带却出现较大的偏差。产生大小的差值,便是修饰造成的结果。这也是为什么有些抗体的实际检测分子量和预测分子量有差别的原因之一,蛋白的翻译后修饰对于 WB 结果的判定,具有重要的辅助作用。有了这些,再也不用担心做 WB 找不到目的条带啦。

自此,我们通过 UniProt 上的信息了解到蛋白的基本功能、命名与来源、亚细胞定位、结构域及对应序列、翻译后修饰位点等重要信息,他山之石可以攻玉,有效利用这些信息,可以辅助研究工作顺利开展。

最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情