各位医学方的朋友,大家好。今天我们聊一聊富集分析,说到富集分析,你会想到KEGG或者GO富集分析,GO实际上是GeneOntology两个单词的首字母简写,主要包括BP,MF,CC三个部分,分别代表的是生物学过程,分子功能和细胞定位。富集分析结果展示的时候,我们一般会画气泡图或者条形图,如下:
气泡图
条形图
但是如果,我们想画出别样的风格怎麽办呢?
那么今天,我们就推出我们的利器-GOplot包,该包主要是对GO富集结果进行可视化,不能进行富集分析,那我们聊聊该包到底具有哪些功能?可以画出什么样的图形?
话不多说,欣赏图:
瞬间有没有找到心动的感觉?
下面进入正题,今天我们看看如何用富集分析的结果,进行GO可视化:
1
安装并加载包,关于包的安装,已经讲过多次,直接上代码:
2
GO富集分析,这次利用clusterProfiler包进行富集分析,当然你还需要安装该包并加载:
3
用内置数据集进行GO富集分析:
注意体会readable参数的意义,该参数的设置,可以是的GO富集的结果的gene以gene symbol形式出现。
4
转成数据框的形式:
5
整理成GOplot所需要的输入格式文件
分别是5列信息,分别为GO的ID, Term名字,该Term所含的gene名,注意是gene symbol,以及p值还有所属的类别 Category。5列的列名称要注意不能轻易改动,分别为ID, Term,Genes,adj_pval和Category。
6
整理gene的信息,该信息要包括两列信息,分别是gene的Symbol还有就是gene的logFC值。
首先用进行ID的转换,从Entre ID转成 Gene Symbol。
结果如下:
接着进行下面的操作,构造gene的data.frame:
这时候,gene的data.frame 如下:
7
构造和弦图需要的输入数据结构,首先是构建一个list对象,接着用circle_dat构建画图的对象circ2,接着用chord_dat构造chord对象,注意在process用了一个unique函数:
8
chord构建好之后,便可以轻松画图了,如下:
结果如下:
还可以使得gene 按照logFC排序:
结果如下:
当然还可以画个热图:
结果如下:
Ok,今天的推文就到这,我们分享了如何在基于clusterProfiler下,进行GO富集分析以及利用该GO富集结果进行GOplot可视化,当然了,关于该包的具体使用,我们医学方推出了详细课程,具体讲解代码的含义以及如何进行其他图形的绘制,比如气泡图,聚类图等,更是如何根据自己的数据如何进行操作整理,画出你满意的GO富集图形,最后,欢迎大家留言,有不正确的地方,也请大家留言指正。
- 本文固定链接: https://maimengkong.com/image/1068.html
- 转载请注明: : 萌小白 2022年6月29日 于 卖萌控的博客 发表
- 百度已收录