图形解读系列 | 散点图也不简单
卖萌控的博客
点击这里进入电脑版页面!体验更好
图形解读系列 | 散点图也不简单
2022-5-2 萌小白


识图:先理解 每个点是什么
(点代表基因、样品、通路或其它的,这个认识可以来自于常识,来自于自己对数据的认识,或来自于文章作者的描述),然后看 横轴代表什么 、
纵轴代表什么 ,再看图例中展示的其他信息如颜色、大小和形状分别代表什么。这些都理顺了,图理解就不难了。







来源:https://www.r-graph-gallery.com/272-basic-scatterplot-with-ggplot2.html



这是个 一般的散点图 ,展示的是X轴变量 Sepal.Length 和Y轴变量 Sepal.Width ,展示的是花萼的长度和宽度的关系。



散点图研究的是两个数值型变量之间的关系,凡是想展示分布状态的都可以使用散点图。它在生物信息分析中有应用广泛,且基于多样的“面貌”,散点图的具体使用形式是根据所需要展现的“故事”来绘制。常见的有:



具体使用 基因表达散点图





>




Dot plot 是单细胞中常用来展示不同细胞簇中代表性基因表达的一个图。



这个散点图来源于一篇 cell 文章- Mapping the Mouse
Cell Atlas by Microwell-Seq 。作者分析成年鼠肺组织单细胞数据聚类得到了 32
个细胞簇(Y轴)。这个散点图的每一列是一个基因,每一行是一个细胞簇,不同颜色表示基因在对应细胞簇的平均表达量。而且相比于热图来讲,这个散点图中点的大小表示对应细胞簇中表达有对应基因的细胞所占的比例,这为结果解读提供了另一维度的信息。



肿瘤大小散点图






>




在上图中,Y轴是肿瘤体积大小,X轴有样本基因型分组信息( TCRα 和 WT
)和样本接受的处理信息( GVAX 和 anti-PD1 有无),每个点都是一个样本。 * 表示组与组之间 Student’s t-tests
的P值( ** P<0.01; *** P<0.001; **** P<0.0001 )。其展示优势是体现出检测的样本量。



当检测样本数且样本点趋势一致的时候,可以排布出悦人的性状和展示更高的可信度。此图在简单的散点图还添加了箱线图中的 上四分位数、中位数和下四分位数 ,用以从统计角度地展示肿瘤大小分布情况( 可视化之为什么要使用箱线图? )。



自对照样品或样品两两相比散点图展示






>




这个图展示某个通路上的基因在不同样本表达的相对高低和样品内表达的一致性。纵坐标和横坐标都是样本间差异基因比较得到的 log(FC) 值。这在整合多套数据时可以根据趋势的共性信息互相印证。



Jitter-plot展示差异基因分布






>




上图的抖动图 jitter plot
有着尽量多的二维信息,每个点是一个基因,类似于火山图的一维展示形式,横坐标是 log2(FC) ,这意味着越往两侧的点, log2(FC)
也就越小或者越大,即基因变化倍数越大,同时也可以用颜色标注出几个比较关注的基因,避免直接在图上标记名字而出现标签重叠的现象。



样本突变数目分布






>



曼哈顿图





曼哈顿图在用于差异基因时表达的意思与火山图类似,但信息更多了一些。此图中每个点代表1个OTU,颜色表示OTU所属的物种分类信息,形状表示其是否显著上下调,大小代表OTU的平均丰度。



绘图 推荐教程 无需代码即刻绘制



发表评论:
昵称

邮件地址 (选填)

个人主页 (选填)

内容