首页 > 科研教程 > 收藏|零基础学R,数据框-单表操作来啦
2022
06-02

收藏|零基础学R,数据框-单表操作来啦

小助理说:今天是你学习R的第4天,每一串代码都有它故事,从bug制造机到修改高手,你的每一步都是在成长。

预计阅读时间3分钟

文章目录

1 按行操作

  • 1. 1 过滤
  • 1.2 排序
  • 1.3 添加新行

2 按列操作

  • 2.1 过滤
  • 2.2 添加新列
  • 2.3 变量重命名

3 管道操作

通常我们将EXCLE表格或者分隔符分割的文本文件导入R中进行处理,这些数据在R语言称为数据框也可以叫做数据集,数据框中的行、列也分别称为观测和变量。

应用于数据框的函数和R包有很多,目前对数据框处理速度比较快的两个R包是鼎鼎大名的dplyr包和tidyr包,这两个包最主要的三个作用分别是:

  • 单个数据框的操作
  • 两个数据框的操作
  • 数据框的重塑

接下来小助理将通过三篇文章分别介绍这三类操作、首先介绍的是单个数据框的操作,若掌握了单个数据框的操作、基本上可以满足我们大部分关于数据框处理的需求,在介绍之前我想先回顾一下关于数据框处理的基础函数。

下面让我们正式进入数据框的世界!

1 按行操作

1. 1 过滤

dplyr包中filter()函数筛选满足条件的行

filter()函数可以进行的逻辑型操作(TRUE、FALSE)和布尔型操作(或、且、非

limma包中avereps()函数对某列中相同元素所在的行取均值

1.2 排序

arrange()函数按某列值的大小对数据集进行排序

1.3 添加新行

add_row()函数可以在指定的行前后添加新的一行

2 按列操作

2.1 过滤

用select()函数可以对数据集按列进行筛选。

2.2 添加新列

2.3 变量重命名

3 管道操作

dplyr包还有一个强大的功能是通过管道操作符%>%进行管道操作,所谓管道操作就是让上一个处理的结果作为下一个处理的输入,这样可以减少变量(赋值对象)的命名,提高数据处理的效率,下面以一个例子来解释什么是管道操作。

End

科研路漫其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。



最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情