2022 06-27 从另一个视角看 R 语言的方言 Tidyverse 从另一个视角看 R 语言的“方言” Tidyverse,以及 RStudio 对 Tidyverse 的提倡。作者简介作者 Norm Matloff 为 UC Davis 计算机科学教授(曾任 UCD 统计学教授)。中文翻译及投稿至 COS 经过作者 同意 [1] 。文中的“我”为作者视角,但译文中存在的任何不妥之处当然很可能是由译者引入的,还望读者不吝 赐教 [2] 。...阅读全文>&g... 阅 读 全 部 >
2022 06-27 R语言自然语言处理:关键词提取与文本摘要(TextRank) 作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:[email protected]关于提取关键词的方法,除了TF-IDF算法,比较有名的还有TextRank算法。它是基于PageRank衍生出来的自然语言处理算法,是一种基于图论的排序算法,以文本的相似度作为边的权重,迭代计算每个文本的TextRa... 阅 读 全 部 >
2022 06-24 学习笔记 | R 语言绘制热图的 10 种方法 说在前面此前我们已经推送了不少深入解读的文章,今天希望做一点新的尝试——介绍 R 语言绘图。这一期分享 R 语言绘制热图的案例,希望大家通过案例感受 R 语言的强大,同时消除对热图等看似高大上的图形的恐惧感,在文献阅读时更加从容,今后也尝试去绘制这样炫酷的图,如果能够放到文章里面就完美了。什么是 R 语言?R 语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。我之所以学 ..... 阅 读 全 部 >
2022 06-24 So easy!搞定数据质控,这三张图学会就够了! 学会这3张图,搞定数据质控So easy嗨,小伙伴们大家好~!上期我们讲到数据质控的重要性,即在表达差异分析之前需查验数据质量是否合格,如下面3张图所示,热图、PCA图和聚类树的结果均表示实验组和对照组分开的比较好,数据质量可。那么这期我们就接着这个话题,来看看如何绘制这3张图,搞定数据质控问题So easy!▌加载示例数据加载基因表达谱和样本信息文件,gene exp res是已完成基因...阅... 阅 读 全 部 >
2022 06-24 pheatmap绘制“热图”,你需要的都在这 热图可以聚合大量的数据,并可以用一种渐进色来优雅地表现,可以很直观地展现数据的疏密程度或频率高低。 本文利用R语言 pheatmap 包从头开始绘制各种漂亮的热图。参数像积木,拼凑出你最喜欢的热图即可,如下图: 基因和样本都可以单独聚类,排序,聚类再...阅读全文>&g... 阅 读 全 部 >
2022 06-24 R语言绘图:28个实用程序包 全文注释# 示例参考帮助文档# 我用Rstudio重现了所有示例# 初识R语言,请戳我的原创推文“”与“”# 使用Stata绘图,请戳我的原创推文“”# 本文以字母顺序排序程序包# 更多用于R语言绘图的程序包,欢迎在留言区补充cartogram扭曲的地图,以传达统计信息开发Sebastian Jeworutzki,...阅读全文>>... 阅 读 全 部 >
2022 06-24 R语言:circos图养成记 这次我们来个GC含量的圈图,同样的,我在这里也会描绘出各种GC含量圈图的画法,开开眼界。GC含量图在基因组circos图中算是非常有分量的,各种GC含量圈图的表达形式6的飞起。下面开始画几种类型的GC圈图。首先,加载circlize R包library(circlize)读入染色体数据和GC含量数据data<-read.table("chrom.txt",head=T,stringsAs..... 阅 读 全 部 >
2022 06-23 如何让你的图变得高大上之ComplexHeatmap ComplexHeatmap是 Zuguang Gu博士开发的一款可以绘制复杂热图的一个包,即可实现简单热图的功能,更能绘制更复杂的热图。复杂的热图有效地可视化不同数据集源之间的关联并揭示潜在模式。 ComplexHeatmap包提供了一种高度灵活的方式来排列多个热图并支持各种注释图形。技术小编之前对这个包做过简单介绍( 如何让你的图变得高大上之COMPLEXHEATMAP ),这次介绍两个简单实... 阅 读 全 部 >
2022 06-23 蛋白组学研究,R语言实用技巧—热图,运用pheatmap包方法 编者按热图:通过热图可以简单地聚合大量数据,并使用一种渐进的色带来优雅地表现,最终效果一般优于离散点的直接显示,可以很直观地展现空间数据的疏密程度或频率高低。你还不会画热图吗?不管您是做蛋白组学、代谢组学或者多层组学研究。热图是文章里常见的图,色彩变化丰富的热图为文章亮色不少。热图可以说是生信中最为常见的图形可视化方式,用以展现表达分布模式。热图可以用于解决组学研究的什么问题?根据...阅读全文&... 阅 读 全 部 >
2022 06-23 R语言也能玩ps?magick包你值得拥有 作者:鲁伟,热爱数据,坚信数据技术和代码改变世界。R语言和Python的忠实拥趸,为成为一名未来的数据科学家而奋斗终生。个人公众号:数据科学家养成记 (微信ID:louwill12)今天要给大家介绍的是2017年的一款新包——magick包。可能大家看到推文题目也都知道了,这是一款图片与图像处理的扩展包,以后ps能做的R语言一定程度上也可以做啦。毕竟从大数据的角度来讲,图片图像数据也是数据嘛。话不... 阅 读 全 部 >