2022 06-04 30 天学会R DAY 13:apply族函数:用来批量作业的函数 R语言中,apply族函数是非常重要的函数,它在很多场景下,可以代替循环语句,简化程序写作过程,实现高效的统计分析,因此我们称之为批量处理函数。利用apply族函数可将某函数作用到一系列数据对象上,包括标量、向量、矩阵、多维数组、数据框、列表。我们可以同时纳入多个向量、数据库、列表、变量,进行变量的转换、统计描述。 此外,apply函数另外一个优势是它可以批量开展自编或者系统自带函数的运...阅读... 阅 读 全 部 >
2022 06-04 30天学会R DAY10:缺失值识别及处理 缺失值是数据中普遍存在的现象,信息无法获取、遗漏、异常值都有可能造成数据的缺失。缺失值的存在会影响数据分析,导致结果存在偏差。R语言中,缺失值用NA和NaN表示,最常用的是用NA符号表示该数据遗失、不存在或异常。开始之前,我们先读入elder1、elder2这两个文件elder1<-read.csv("elder1.csv")elder2<-re...阅读全文>>... 阅 读 全 部 >
2022 06-04 30天学会R DAY9:变量添加及转化 日常数据整理需要添加变量,对变量进行计算转化。本章将给大家介绍在数据集对原变量进行计算并添加变量及对原变量的数据进行转化。开始之前,我们先读入elder1、elder2这两个文件elder1<-read.csv("elder1.csv")elder2<-read.csv("elder2.csv")一、添加变量数据集$新变量<-...阅读全文>>... 阅 读 全 部 >
2022 06-04 30天学会R DAY8:数据合并及变量更改 在数据进行前期处理中经常会涉及到数据集的合并,变量名、变量属性的更改及变量的排序,这一章就这四个方面给大家做一下简单介绍。开始之前,我们先读入elder1、elder2这两个文件elder1<-read.csv("elder1.csv")elder2<-read.csv("elder2.csv")一、数据集合并rbind(数据集1,...阅读全文>>... 阅 读 全 部 >
2022 06-04 30天学会R DAY7:数据提取及删除 当我们只需要对数据集中的部分数据进行分析,就需要用的数据的提取,这是日常最常用的命令。开始之前,我们先读入elder1这个文件elder1<-read.csv("elder1.csv")dim(elder1) #显示几行几列[1] 5846 12 显示5846行,12列一、 数据提取1. 子集的提取(行的提取)数据集子集提...阅读全文>>... 阅 读 全 部 >
2022 06-04 30天学会R DAY6: 数据导入导出及描述 一、 工作空间工作空间,意味着,所有R的程序文件、数据集、其他相关资料都保存在某一个文件夹下面,十分方便提取。在一个R语言程序结束后,工作空间可以保存它的映像,在下次启动R时,该工作空间,包括历史代码就会自动重新加,非常方便。但没次使用的包需要重新加载。1.设置工作空间方法一,采用setwd()语句,设置工作空间,设置的文件夹需事先在硬盘中建立,R语言无法创建新的文件夹。...阅读全文>&g... 阅 读 全 部 >
2022 06-03 30天学会R DAY5: R语言对象的操作总结 R语言主要分析的对象是数据集,R语言数据集主要是向量、矩阵、数据框、列表、数组等,我们主要介绍前4种。前面2文已经进行了4种对象的介绍,现在本文将4种对象的程序方法进行进一步总结和凝练。一、is和as系列函数is 和as系列函数涉及不同类型数据和对象的鉴定和转换。我们经常在R语言编程过程中需要了解某一种数据的类型,也可能进行转换方便计算,所以诸位要熟悉他们。is系列是判断某一个...阅读全文>... 阅 读 全 部 >
2022 06-03 30 天学会R DAY 15:tidyr包,数据整理另外一个利器 tidyr包 用来处理宽数据和长数据,用来进行字符串变量的拆分和合并,在医学大数据领域用的较多,有兴趣的朋友可以了解下。本文将演示tidyr包中下述四个函数的用法:1. gather—宽数据转为长数据。2. spread—长数据转为宽数据。3. unit—多列合并为一列4. separate—将一列分离为多列tidyr包安装及载入i...阅读全文>>... 阅 读 全 部 >
2022 06-03 R语言数据清洗之数据排排坐:轻松实现脏数据的预处理! 俱往矣,数风流人物,还看今朝!从今天开始,R语言数据清洗或者叫做数据预处理的大幕正式拉开!众所周知,在现实工作中,我们面临的几乎所有数据都是脏数据,即乱七八糟的数据,要让这些数据发挥价值,就必须要对其进行整理、修饰,让其变成一个软件可接受,可识别的整洁数据。当然了,100个数据科学家就会有98个说,数据清洗最费时间费脑子。这是可想而知的,因为数据的读取与分析这都是固定的套路,唯有数据的清洗不固定,... 阅 读 全 部 >
2022 06-03 R语言数据处理方法~小结 文章目录1. R自带函数2. reshape2数据重构3. dplyr4. tidyr5. 字符串处理1. R自带函数1.1 转置使用函数t()可对一个矩阵或数据框进行转置,对于数据框,行名将变成变量(列)名。数列array进行维度转换 aperm1.2 整合数据aggregate在R中使用一个或多个by变量和一个预先定义好的函数来折叠(collapse)数据。调用格式为:其中x是待折叠的数据对象... 阅 读 全 部 >