小助理说:今天是你学习R的第4天,每一串代码都有它故事,从bug制造机到修改高手,你的每一步都是在成长。
预计阅读时间3分钟
文章目录
1 按行操作
- 1. 1 过滤
- 1.2 排序
- 1.3 添加新行
2 按列操作
- 2.1 过滤
- 2.2 添加新列
- 2.3 变量重命名
3 管道操作
通常我们将EXCLE表格或者分隔符分割的文本文件导入R中进行处理,这些数据在R语言称为数据框也可以叫做数据集,数据框中的行、列也分别称为观测和变量。
应用于数据框的函数和R包有很多,目前对数据框处理速度比较快的两个R包是鼎鼎大名的dplyr包和tidyr包,这两个包最主要的三个作用分别是:
- 单个数据框的操作
- 两个数据框的操作
- 数据框的重塑
接下来小助理将通过三篇文章分别介绍这三类操作、首先介绍的是单个数据框的操作,若掌握了单个数据框的操作、基本上可以满足我们大部分关于数据框处理的需求,在介绍之前我想先回顾一下关于数据框处理的基础函数。
下面让我们正式进入数据框的世界!
1 按行操作
1. 1 过滤
dplyr包中filter()函数筛选满足条件的行
filter()函数可以进行的逻辑型操作(TRUE、FALSE)和布尔型操作(或、且、非)
limma包中avereps()函数对某列中相同元素所在的行取均值
1.2 排序
arrange()函数按某列值的大小对数据集进行排序
1.3 添加新行
add_row()函数可以在指定的行前后添加新的一行
2 按列操作
2.1 过滤
用select()函数可以对数据集按列进行筛选。
2.2 添加新列
2.3 变量重命名
3 管道操作
dplyr包还有一个强大的功能是通过管道操作符%>%进行管道操作,所谓管道操作就是让上一个处理的结果作为下一个处理的输入,这样可以减少变量(赋值对象)的命名,提高数据处理的效率,下面以一个例子来解释什么是管道操作。
End
科研路漫其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。
- 本文固定链接: https://maimengkong.com/kyjc/950.html
- 转载请注明: : 萌小白 2022年6月2日 于 卖萌控的博客 发表
- 百度已收录