2022 06-03 30 天学会R DAY 15:tidyr包,数据整理另外一个利器 tidyr包 用来处理宽数据和长数据,用来进行字符串变量的拆分和合并,在医学大数据领域用的较多,有兴趣的朋友可以了解下。本文将演示tidyr包中下述四个函数的用法:1. gather—宽数据转为长数据。2. spread—长数据转为宽数据。3. unit—多列合并为一列4. separate—将一列分离为多列tidyr包安装及载入i...阅读全文>>... 阅 读 全 部 >
2022 06-03 R语言数据清洗之数据排排坐:轻松实现脏数据的预处理! 俱往矣,数风流人物,还看今朝!从今天开始,R语言数据清洗或者叫做数据预处理的大幕正式拉开!众所周知,在现实工作中,我们面临的几乎所有数据都是脏数据,即乱七八糟的数据,要让这些数据发挥价值,就必须要对其进行整理、修饰,让其变成一个软件可接受,可识别的整洁数据。当然了,100个数据科学家就会有98个说,数据清洗最费时间费脑子。这是可想而知的,因为数据的读取与分析这都是固定的套路,唯有数据的清洗不固定,... 阅 读 全 部 >
2022 05-24 手把手教你用R处理常见的数据清洗问题(附步骤解析、R语言代码) 作者:James D. Miller;翻译:王雨桐;校对:万文菁本文约5300字,建议阅读10+分钟。本文将介绍数据清洗过程的主要步骤,并通过案例和代码演示如何利用R语言进行数据清洗。R是进行运算、清洗、汇总及生成概率统计等数据处理的一个绝佳选择。此外,由于它独立于平台、短期内不会消失,所以生成的程序可以在任何地方运行。并且,它具备非常棒的辅助资源。本文摘录自James D.Miller撰写...... 阅 读 全 部 >
2021 10-22 手把手教你用R处理常见的数据清洗问题(附步骤解析、R语言代码) 本文约5300字,建议阅读10+分钟。本文将介绍数据清洗过程的主要步骤,并通过案例和代码演示如何利用R语言进行数据清洗。R是进行运算、清洗、汇总及生成概率统计等数据处理的一个绝佳选择。此外,由于它独立于平台、短期内不会消失,所以生成的程序可以在任何地方运行。并且,它具备非常棒的辅助资源。本文摘录自James D.Miller撰写的《数据科学统计学》(Statistics for Data S...... 阅 读 全 部 >
2021 10-16 使用dplyr进行数据操作(30个实例) dplyr软件包是R中功能最强大,最受欢迎的软件包之一。该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等。本文包括一些示例和如何使用使用dplyr软件包来清理和转换数据。这是一个关于数据操作和数据处理的完整教程。什么是dplyr?dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它...阅读全文>... 阅 读 全 部 >