首页 > 科研绘图 > 通路富集怎么做?这里全告诉你
2022
06-23

通路富集怎么做?这里全告诉你

近几十年,系统生物学慢慢走近科研者的视野,主要着眼于研究细胞信号转导、基因调控网络、生物系统组成。多组学联合分析可以由表及里,解析直接原因和根本原因,深入阐释作用机理。在多组学的联合应用中,最终都要落脚到功能注释和通路富集分析,其中基于通路富集分析的图形展示丰富多样,通过此分析可找到与研究相关的通路、关键基因/代谢物,以便进行后续的数据挖掘。

进行富集分析的软件有很多,本篇主要安利一下clusterProfiler,它是一个专门用于GOKEGG以及GSEA富集分析的R包,我们以代谢组数据分析为例,进行KEGG通路富集分析。

安装

BiocManager::install(‘clusterProfiler’)

加载

library(clusterProfiler)

计算富集所用的函数为enricher,其基本的参数:(1gene是指用于富集的差异代谢物ID;(2TERM2GENE一个2的数据框,第一列为通路IDko01230第二列为注释到该通路代谢物ID这个数据是背景集即包含所有通路注释的代谢物3TERM2NAME也是一个2数据框,第一列为通路ID,第二列是通路的具体名称其他参数可参考官方文档https://bioconductor.org/packages/release/bioc/manuals/clusterProfiler/man/clusterProfiler.pdf

查看输入

head(TERM2meta)

# KEGG_ID metabolite_ID

#1 ko01230 meta4

#2 ko01230 meta20

#3 ko01230 meta23

head(TERM2NAME)

# KEEG_ID KEGG_name

#1 ko00010 Glycolysis / Gluconeogenesis

#2 ko00020 Citrate cycle (TCA cycle)

head(metaids)

#[1] "meta10" "meta1017" "meta1020" "meta1024" "meta1031" "meta1034"

富集分析

#为了展示所有结果,将p值设为1

enrich<-enricher(gene=metaids,TERM2GENE=TERM2meta,TERM2NAME=TERM2NAME,pvalueCutoff= 1,qvalueCutoff = 1)

#查看富集结果

由于软件原本是用于基因分析的,所以部分列显示Gene

head(enrich@result)

接下来,咱们就可以作图啦~

绘制柱图

barplot(enrich,color='pvalue',bg=NULL,grid=NULL)

绘制点图

了修改横轴名称,加载ggplot2

library(ggplot2)

dotplot(enrich,color='pvalue',)+xlab('metaboliteRatio')

绘制网络图

cnetplot(enrich,vertex.label.cex=0.1,colorEdge = TRUE)

富集分析是多组学联合分析的基础,基于此百迈客可以实现三个组学之间的联合分析,优质美图一键绘出。


为了缩短分析周期,提升个性化挖掘空间,百迈客云提供专业的生信分析平台(http://www.biocloud.net/),最新上线的代谢组云APP兼具标准分析、联合分析和个性化分析功能,同时提供海量在线资源和视频,欢迎一起开启代谢组准确检测,深入挖掘新时代

代谢物、基因、菌群之间的相关性热图

*为P<0.05,**为P<0.01

代谢物、基因、菌群之间相关性网络图

线颜色表示正负相关,线粗细表示相关性强度

代谢物、基因、菌群之间CCA图

基因、菌群与原点的连线和代谢物构成的夹角表示了之间相关性


转自:百迈克


最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情