2022 08-21 用R语言把数据玩出花样 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网…都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域。让我们一起动起来吧,开始R的极客...阅... 阅 读 全 部 >
2022 08-21 ggplot2学习笔记系列之利用ggplot2绘制误差棒及显著性标记 taoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/公众号:生信大课堂绘制带有误差棒的条形图library(ggplot2)#创建数据集df <- data.frame(treatment = factor(c(1, 1, 1, 2, 2, 2, 3, 3, 3)),response = c(2, 5, 4, 6, 9, 7, 3, 5... 阅 读 全 部 >
2022 08-20 新一代配色R包,还不赶快升级你的配色方案? 当我开始使用R时,像任何初学者一样,我想要一个真正能够工作的代码和一个最低限度可理解的图像,并且很长一段时间这是我的主要目标,但是一旦这一点完成后,我意识到我的可视化看起来很糟糕,特别是在比较和审查其他博客和网站之后,我开始搜索如何改进我的可视化。下面,创建一个简单且专业的图像的一些技巧,以吸引读者的注意力。01 创建可视化让我们开始一个简单的可视化,来自diamonds数据集的直方图。1.1 包... 阅 读 全 部 >
2022 08-19 PCA、LDA、MDS、LLE、TSNE等降维算法的Python实现 整理 | 夕颜【导读】网上关于各种降维算法的资料参差不齐,但大部分不提供源代码。近日,有人在 GitHub 上整理了一些经典降维算法的 Demo(Python)集合,同时给出了参考资料的链接。PCA资料链接:https://blog.csdn.net/u013719780/article/details/78352262https://blog.csdn.net/u013719780/articl... 阅 读 全 部 >
2022 08-19 R语言从入门到精通:Day14(PCA & tSNE) 实际工作中要处理的变量之间的关系往往是错综复杂的。处理这些多变量数据的最大挑战之一就是信息过度复杂,若数据集有100个变量,如何了解其中所有的交互关系呢?即使只有20个变量,当试图理解各个变量与其他变量的关系时,也需要考虑190对相互关系。主成分分析等方法是用来探索和简化多变量复杂关系的常用方法。在这里我们重点介绍两种简化多变量复杂关系,即降维的方法:主成分分析和t-SNE(t-Distri...... 阅 读 全 部 >
2022 08-18 小学生都看得懂之 白话数据降维 据降维是数据分析中最常用到的一种技术了,这篇小文将试图用大白话讲一讲数据降维到底是什么,有什么用,常用的方法分别是什么?希望写的让小学生也能听懂,下面先为各位奉上这篇小文的思维导图。这篇文章贯穿始终的一个故事场景是如何在一个小镇上将横纵的街道编号,例如科技三路和凤城五路的接口这样一个用俩个数字标注的位置信息,转化更一个只用一个数字标识的位置描述。在上述的例子中,原来的位置信息有俩个维度,...阅读... 阅 读 全 部 >
2022 07-10 【转录组学】LncRNA鉴定思路与软件比较分析 1.非编码RNA简介非编码RNA是一类被认为不具备编码能力RNA,目前已知的已经有十多种,主要包括了:小RNA(sRNA) <40nt、小干扰RNA、miRNA(18-24nt)、长非编码lncRNA(>200nt)、核糖体RNA、核小RNA、核仁小RNA等等。随着人们认知的逐渐深入,发现这些非编码RNA在转录调控上发挥着重要的作用,并且其他部分同样具有编码...阅读全文>>... 阅 读 全 部 >
2022 07-09 16S从实验到数据分析最全流程 本文主要介绍了16S的实验、建库、数据分析等过程,也是我自己近期的一个小总结,初学之时从很多前辈的无私分享中受益良多,在此也和大家分享一些我的见解,当然我也只是一个初学者,还有很多不完备之处,希望能与各位一起交流分享。导航本文一共分为三个部分:实验部分建库测序16S测序数据分析一. 实验部分:DNA提取与质检1...阅读全文>>... 阅 读 全 部 >
2022 07-09 快速识别异常值,你可能需要箱线图分析 当你在做数据总结分析,或者科研调查分析,甚至季度年度总结汇报,需要查看数据的分布情况以及是否有异常情况来形成结论辅助进一步分析时,那么哪种图表能够清晰直观地展现出这一信息呢?答案只有一个,那就是...箱线图!什么是箱线图箱线图,又名为盒须图,盒式图,通常用于展示一组数据的分布情况,因为主题形状像一个箱子,所以得名箱线图。它主要用于反映原始数据分布的特征,还可以进行多组数据...阅读全文>&g... 阅 读 全 部 >
2022 07-08 dplyr包-行选择的方法 《R包学习》专栏·第3篇 文| R学习者2352字 | 6分钟阅读这是dplyr包系列第三篇文章。前两篇文章如下:前两篇文章是从 数据列的角度做选择和变换处理。这篇文章是从 数据行的角度,描写行选择的一系列操作与方法。数据的行,可以看作为 观察、样例、对象等。 数据的行选择,主要包括如下内容:1 基于比较运算的行选择2 基于字符匹配的行选择3 基于正则模式的行选择4 基于多条件的行选择5 跨越多列... 阅 读 全 部 >