蛋白组学研究,R语言实用技巧—热图,运用pheatmap包方法
卖萌控的博客
点击这里进入电脑版页面!体验更好
蛋白组学研究,R语言实用技巧—热图,运用pheatmap包方法
2022-6-23 萌小白


编者按



热图:通过热图可以简单地聚合大量数据,并使用一种渐进的色带来优雅地表现,最终效果一般优于离散点的直接显示,可以很直观地展现空间数据的疏密程度或频率高低。



你还不会画热图吗?



不管您是做蛋白组学、代谢组学或者多层组学研究。热图是文章里常见的图,色彩变化丰富的热图为文章亮色不少。热图可以说是生信中最为常见的图形可视化方式,用以展现表达分布模式。



热图可以用于解决组学研究的什么问题?



根据在蛋白组学、代谢组学、多层组学中多年的研究经验总结。热图一般有两大用途:数据质量控制和展示研究对象的差异变化情况。通过热图,我们能很直观的看到不同分组之间的整体表达模式,因此可以迅速的判断同组之间、各样本间的重复性如何?从而判断实验处理是否正确;数据是否可信可靠符合逻辑。



热图是怎么绘制的呢?



简单的来说,您只要把表达量和组别的数据做成表格,然后调用R语言包就可以绘制热图。这个实际操作起来非常简单快捷易懂。下面跟着小编一起学习一下吧~~



首先安装及加载pheatmap包



#安装包



install.packages("pheatmap")



#加载包



library("pheatmap")



pheatmap包中有很多参数,用于满足我们对热图的调整。虽然有很多参数,通过help(pheatmap),可以查看所有参数的功能。下面给大家讲解一下pheatmap部分参数的实用。



# 数据创建



test = matrix(rnorm(200), 20, 10)



test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 1



test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2



test[15:20, seq(2, 10, 2)] = test[15:20, seq(2, 10, 2)] + 10



colnames(test) = paste("Test", 1:10, sep = "")



rownames(test) = paste("Gene", 1:20, sep = "")



# 画热图



pheatmap(test,”1.pdf”)






上面的热图很明显不是我们想要的,所以要做一些调整,数据的每一行是基因对应的一个指标,所以对每一行进行数值的中心化和标准化。



pheatmap(test,filename="2.pdf",scale="row")






那又该怎么修改颜色呢?下面就给大家展示。



pheatmap(test,filename="3.pdf",scale="row",colour=colorRampPalette(c("blue","white","red"))(100))






接下来可以对图形进行调整,是否聚类(cluster_rows和cluster_cols);热图单元格大小(cellwidth)和高(cellheight);行聚类树高度(treeheight_row,列聚类是treeheight_col),默认是50。



有感兴趣的小伙伴可以自己尝试一下...



布置作业:



有兴趣的老师可以尝试用上面的语言进行绘制热图哦~~想画更炫热图的老师,可以使用circlize包画一个弯曲的热图。






做蛋白组学、代谢组学、多层组学研究机构,本期针对组学研究做的部分生信分析作图技巧


转自:鹿明生物
发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容