首页 > 组学教程 > 单细胞组学测序分析中实用性超强的配受体对数据库
2023
04-24

单细胞组学测序分析中实用性超强的配受体对数据库

不论是做实验还是做高通量测序分析,我们往往离不开要对分子层面的作用机制进行研究,而其中基因可以编码下游蛋白,通过调控蛋白之间的相互作用或是影响蛋白质本身行使的功能从而最终影响表型的变化。这么一来,对于蛋白作用的了解就显得格外重要了。

这些信息可以来源于KEGG数据库的注释也可来源于Uniprot对蛋白功能的注释,但不论是存在于KEGG还是Uniprot数据库的信息,都过于分散,是否有已经整理好的蛋白质配受体对互作数据库信息呢?答案是,有的。

今天想给大家介绍的就是四款目前十分主流的蛋白质配受体对数据库:String数据库、CellphoneDB、Cellchat以及PlantPhoneDB。其中最被科研人员们所熟知的当仁不让是String数据库了。

String数据库

截至目前,String数据库涵盖了14094种生物的六千七百万种蛋白质的20亿相互作用信息。String数据库信息来源于高通量实验数据、计算机基因组测序、自动文本挖掘以及其他数据库的数据信息,是目前蛋白质互作数据库中覆盖物种最多、互作信息最大的一个数据库。

网页版(http://string.embl.de/)整体的操作也是十分简单。

点击上面的“Search”进入搜索界面,选择左侧的内容列通过不同的信息进行搜索。

不仅可以根据单个或多个的蛋白ID、序列进行搜索,还可直接搜索蛋白家族或者是注释相关的通路、疾病等。最近也是新加了一个功能,可以将目标关注的蛋白质群进行上传,String数据库会根据数据库中包含的信息对上传的蛋白质功能进行注释。

此外,相比于其他蛋白质数据库,String数据库还包含了配体-受体对的上游转录因子调控信息,如果我们可以通过实验或数据分析找到目标关注的转录因子,那么我们是否可以通过String数据库找到其调控的下游关键作用蛋白质呢,答案不言而喻。

那如果我们并没有得到关于上游转录因子的信息,不确定哪些是需要我们关注的互作蛋白质呢,是否有数据库整理出了各种蛋白互作信息,让我们可以直接查看呢?答案是,有的,CellphoneDB和CellchatDB便是。

CellphoneDB数据库

CellphoneDB是一款细胞通讯分析工具自建的配体-受体数据库,该数据库集成于UniProt、Ensembl、PDB、IUPHAR等,共存储上千种蛋白质参与的2,923种相互作用。

更新到第四版CellphoneDB的数据[1]在原先仅具有异聚体复合物的基础上,还加入了细胞间通讯的特定蛋白质和非蛋白质家族(即不由基因编码)的通讯配对关系,对于蛋白质的功能研究来说多了一个新的途径,如多组学关联分析——蛋白质组学与转录组组学等的研究分析可以获得信息来源又多了一处。

网页版(https://www.Cellphonedb.org/)也是可以很快速的搜索到目标关注的蛋白配对信息,输入你关注的Ensenbl ID、基因名称、Uniprot ID亦或是蛋白、复合物的名称都可以进行数据库信息的搜索。

Cellchat数据库

Cellchat于2021年发表在NC杂志上 [2],同样也内置了自建的细胞配受体对数据库。基于KEGG通路注释的基础上,从已发表的文献中又补充了部分配受体对信息,构建了人及小鼠的配受体对数据库,共有1939对互作的人配受体对信息及2021对互作的小鼠配受体对信息,其中包含旁分泌/自分泌信号相互作用、细胞外基质受体相互作用以及细胞间接触相互作用的注释类型。

与CellphoneDB最新版本相似,Cellchat除了考虑单个配体-受体信息之外,还考虑了复合多聚体的调控。此外,由于配受体互作可能存在共激活或者是竞争性结合的拮抗作用,因此作者也是在数据库中添加了部分配受体对在通路内激活或拮抗的信息。

相比于CellphoneDB仅可对配受体进行细胞互作分析外,Cellchat软件还可对各种感兴趣的通路进行细胞类型间通路互作的配受体对进行分析,在配受体的基础上可以获得通路相关的调控信息。Cellchat目前有网页版也有软件版,网页版(http://www.Cellchat.org/index_inner.html)同样可以进行配受体对信息的搜索,也可以基于通路进行查找。软件版则是基于R语言环境运行的工具,内置有配受体对水平以及通路通讯水平等分析内容的可视化分析流程。

目前已有的蛋白质数据库除了医学常见的人和小鼠物种外,其实也不乏其他模式物种,去年7月也是发表了一篇汇总好的植物相关的蛋白质配受体对数据库——PlantPhoneDB [3]

PlantPhoneDB数据库

PlantPhoneDB包含的物种配受体对信息还是相当丰富的(https://jasonxu.shinyapps.io/PlantPhoneDB/),收录了拟南芥、水稻、番茄、玉米和杨树五个物种的大量高置信度的配体-受体互作对。

此外,该数据库还收集了以上5个物种15个组织的29份单细胞数据的信息,包括处理条件、细胞个数以及测序平台等,并提供可获取的在线文档,其中包含了配体-受体互作对的识别和筛选的标准,以及单细胞数据处理的分析流程。

同时,研究人员也开发了相应的R包PlantPhoneDB用于解析植物细胞通讯的复杂调控网络,还提供多个可视化功能,如热图、气泡图和弦图等。

今天的蛋白质数据库介绍就到此结束啦,关于上面介绍的四个数据库,这里也是做了一个汇总表,大家不妨可以多加利用这些数据库去完成自己的组学分析。



最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情