冲击图(alluvial diagram)是流程图(flow diagram)的一种,最初开发用于代表网络结构的时间变化。实例1. neuroscience coalesced from other related disciplines to form its own field. From PLoS ONE 5(1): e8694 (2010)实例2. Science...阅读全文>&g... 阅 读 全 部 >
分类目录归档:
2022
08-20
08-20
kaggle:R可视化分析金拱门餐厅食物营养性(二)
作者:邬书豪,车联网数据挖掘工程师 ,R语言中文社区专栏作者,R语言中文社区负责人之一。微信ID:wsh137552775知乎专栏:https://www.zhihu.com/people/wu-shu-hao-67/activities第一篇请戳:kaggle:R可视化分析金拱门餐厅食物营养性(一)公众号后台回复“金拱门”下载数据集。#比较不同的脂肪率(类别=牛肉和猪肉 & 鸡...阅读... 阅 读 全 部 >
2022
08-20
08-20
简单!目标基因怎么挑?这个小众分析,堪称高分文章标配!一刻钟包你学会!你一定要试试!
差异基因富集方法之Friends分析大家好,我是阿琛。今天,我们来给大家介绍一种常见的拓展生信分析方法。在常规的⽣信文章中,我们往往能够得到⼀大堆的显著差异表达基因。然而,从⾥面挑选哪⼀个基因出来进行验证常常让我们感到困扰。 通常,我们会从这些特定的蛋白功能信息出发,根据差异基因的条⽬进⾏富集分析,查找与其功能相似或相关的蛋白质,关联、比较、量化,看看是否富集在某个GOterm或者KEGG通路当中... 阅 读 全 部 >
2022
08-20
08-20
R语言学习ggplot2之颜色设置,你学会了吗?
ggplot2是由Hadley Wickham创建的一个十分强大的可视化R包。在使用R作图时,如何使用ggplot2来调整图像中的颜色呢?下面跟着我们一起学习ggplot2的颜色修改函数,制作出更加绚丽多彩的图片。1简单颜色分配在ggplot2中,对于线和点的颜色调整可以直接改变colour参数,如设置colour=“red”等。而对于一些作为对象填充的颜色,如直方图中条形的颜色,...阅读全文&... 阅 读 全 部 >
2022
08-19
08-19
PCA、LDA、MDS、LLE、TSNE等降维算法的Python实现
整理 | 夕颜【导读】网上关于各种降维算法的资料参差不齐,但大部分不提供源代码。近日,有人在 GitHub 上整理了一些经典降维算法的 Demo(Python)集合,同时给出了参考资料的链接。PCA资料链接:https://blog.csdn.net/u013719780/article/details/78352262https://blog.csdn.net/u013719780/articl... 阅 读 全 部 >
2022
08-19
08-19
R语言从入门到精通:Day14(PCA & tSNE)
实际工作中要处理的变量之间的关系往往是错综复杂的。处理这些多变量数据的最大挑战之一就是信息过度复杂,若数据集有100个变量,如何了解其中所有的交互关系呢?即使只有20个变量,当试图理解各个变量与其他变量的关系时,也需要考虑190对相互关系。主成分分析等方法是用来探索和简化多变量复杂关系的常用方法。在这里我们重点介绍两种简化多变量复杂关系,即降维的方法:主成分分析和t-SNE(t-Distri...... 阅 读 全 部 >
2022
08-19
08-19
还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码)
大数据文摘作品编译:寒小阳、蒋宝尚、Sheila、赖小娟、钱天培假设你有一个包含数百个特征(变量)的数据集,却对数据所属的领域几乎没有什么了解。 你需要去识别数据中的隐藏模式,探索和分析数据集。不仅如此,你还必须找出数据中是否存在模式--用以判定数据是有用信号还是噪音?这是否让你感到不知所措?当我第一次遇到这种情况,我简直全身发麻。想知道如何挖掘一个多维数据集? 这是许多数据科学家...阅读全文&... 阅 读 全 部 >
2022
08-19
08-19
毕业救星!这个R包在高分文章常见,实用!好学!
Seurat对象剖析以及Seurat Command List前景回顾首次揭秘!不做实验也能发10+SCI,CNS级别空间转录组套路全解析(附超详细代码!)过关神助!99%审稿人必问,多数据集联合分析,你注意到这点了吗?太猛了!万字长文单细胞分析全流程讲解,看完就能发文章!建议收藏!(附代码)秀儿!10+生信分析最大的难点在这里!30多种方法怎么选?今天帮你解决! ...阅读全文>>... 阅 读 全 部 >
2022
08-03
08-03
tidyverse包:数据科学工作流程
tidyverse包是一个R包集合,在数据导入,数据整理和变换,数据可视化等领域提供了数据科学的解决方案。 tidyverse包可以让数据科学家,统计学家和数据分析师等数据工作者更有效率地从事数据的研究和实践。 tidyverse包是RStudio的首席科学家Hadley Wickham创建的。 tidyverse包遵循数据科学工作流程,为使用者提供一个有效的,可以不断迭代和完善的工作方法和实践步... 阅 读 全 部 >
2022
07-31
07-31
数据科学01- 数据科学家的工具箱 | PASS专题
数据科学家通过许多工具软件利用庞大或者混杂数据去解决回答许多复杂的难题。数据科学问题种类包括:描述性分析(deive analyses)探索性分析(exploratory analyses)推断分析(inferential analyses)预测分析(predictive analyses)因果分析(casual analyses)...阅读全文>>... 阅 读 全 部 >