2022 05-01 如何让R与Python一起工作 | 案例讲解 R(又称R语言)是一款开源的跨平台的数值统计和数值图形化展现工具。通俗点说,R是用来做统计和画图的。R拥有自己的脚本语言和大量的统计、图形库(得益于开源社区),这让她看起来既美又实用。与其他同类软件(如 SPSS)相比,R的特点是纯命令行的,这倒也好,我们更应该把注意力放在数据本身,而非统计工具的UI。R虽说有一套自己的语言,还挺完备,但它最专业的还是做统计和画图,而像连接数据库、文本处...阅读... 阅 读 全 部 >
2022 03-20 R如何直接读取Excel表格数据? 对于24K纯生信小白来说,数据准备绝对是一件令人头疼的问题。还记得我第一次用ClustalX做序列Alinment时一直不出结果,折腾了一下午偶然发现出错仅仅因为文件名是中文的。经过这次教训以后,自己也养成了个习惯,不管是文件名还是表格内容绝不用中文,哪怕是用拼音表示。在《你可能需要一个功能强大一点的文本编辑器……》一文,已介绍过用Notepad++查看Excel中不容易发现的格式错误。可还是有小... 阅 读 全 部 >
2021 10-22 手把手教你用R处理常见的数据清洗问题(附步骤解析、R语言代码) 本文约5300字,建议阅读10+分钟。本文将介绍数据清洗过程的主要步骤,并通过案例和代码演示如何利用R语言进行数据清洗。R是进行运算、清洗、汇总及生成概率统计等数据处理的一个绝佳选择。此外,由于它独立于平台、短期内不会消失,所以生成的程序可以在任何地方运行。并且,它具备非常棒的辅助资源。本文摘录自James D.Miller撰写的《数据科学统计学》(Statistics for Data S...... 阅 读 全 部 >
2021 10-16 使用dplyr进行数据操作(30个实例) dplyr软件包是R中功能最强大,最受欢迎的软件包之一。该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等。本文包括一些示例和如何使用使用dplyr软件包来清理和转换数据。这是一个关于数据操作和数据处理的完整教程。什么是dplyr?dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它...阅读全文>... 阅 读 全 部 >
2021 10-09 我做数据分析工作常用的8个R包 文| R扫地僧1910字 | 6分钟阅读大家好,我是一名数据分析师,目前在一家互联网公司,做私域业务相关的数据分析工作。我经常会用R语言解决数据分析工作系列问题。在此,我分享下做数据分析工作常用的8个R包,也欢迎朋友们补充和分享自己常用的R包。1 dplyr包我用dplyr包做数据的整理工作,包括数据的选择(业务所需的行与列),变量的新增,数据的集成(常用的内连接和左连接),数据的聚合运算(描述性... 阅 读 全 部 >