2022 03-20 R如何直接读取Excel表格数据? 对于24K纯生信小白来说,数据准备绝对是一件令人头疼的问题。还记得我第一次用ClustalX做序列Alinment时一直不出结果,折腾了一下午偶然发现出错仅仅因为文件名是中文的。经过这次教训以后,自己也养成了个习惯,不管是文件名还是表格内容绝不用中文,哪怕是用拼音表示。在《你可能需要一个功能强大一点的文本编辑器……》一文,已介绍过用Notepad++查看Excel中不容易发现的格式错误。可还是有小... 阅 读 全 部 >
2021 12-26 R语言数据处理——数据合并与追加 数据结构的塑造是数据可视化前重要的一环,虽说本公众号重心在于数据可视化,可是涉及到一些至关重要的数据整合技巧,还是有必要跟大家分享一下的。在可视化前的数据处理技巧中,导入导出、长宽转换已经跟大家详细的介绍过了。今天跟大大家分享数据集的合并与追加,并且这里根据所依赖函数的处理效率,给出诺干套解决方案。数据合并操作涉及以下几个问题:横向合并;1. 是否需要匹配字段1.1 匹配字段合并 1.1.1 主字... 阅 读 全 部 >
2021 10-22 手把手教你用R处理常见的数据清洗问题(附步骤解析、R语言代码) 本文约5300字,建议阅读10+分钟。本文将介绍数据清洗过程的主要步骤,并通过案例和代码演示如何利用R语言进行数据清洗。R是进行运算、清洗、汇总及生成概率统计等数据处理的一个绝佳选择。此外,由于它独立于平台、短期内不会消失,所以生成的程序可以在任何地方运行。并且,它具备非常棒的辅助资源。本文摘录自James D.Miller撰写的《数据科学统计学》(Statistics for Data S...... 阅 读 全 部 >
2021 10-11 R语言网络爬虫初学者指南(使用rvest包) 引言网上的数据和信息无穷无尽,如今人人都用百度谷歌来作为获取知识,了解新鲜事物的首要信息源。所有的这些网上的信息都是直接可得的,而为了满足日益增长的数据需求,我坚信网络数据爬取已经是每个数据科学家的必备技能了。在本文的帮助下,你将会突破网络爬虫的技术壁垒,实现从不会到会。大部分网上呈现的信息都是以非结构化的格式存储(html)且不提供直接的下载链接,因此,我们需要学习一些知识和...阅读全文>... 阅 读 全 部 >
2021 10-08 R语言对象的操作总结 现在本文将4种对象的程序方法进行进一步总结和凝练。一、is和as系列函数is 和as系列函数涉及不同类型数据和对象的鉴定和转换。我们经常在R语言编程过程中需要了解某一种数据的类型,也可能进行转换方便计算,所以诸位要熟悉他们。is系列是判断某一个数据中的观察值是何种类型,或者数据属于何种对象与结构• is.character(x) #判断是否为字符型• is.numer...阅读全文>>... 阅 读 全 部 >
2021 10-05 R Markdown:可能是你数据分析报告最好的解决方案 为什么要用Rmd?“如果你是第一次听到R Markdown这个名词的话,可能你会问R Markdown是什么?我们能用它来做什么?怎么使用R Markdown?且听小编跟你道来。”当初人才计划进行到第二阶段的时候,水妈要求我们所有的 R 代码都需要通过R Markdown生成html来提交。一开始并不了解其中奥义,在此之前印象中那只是一个可以用来生成数据分析文件格式的工具。经过一段时间学...阅读... 阅 读 全 部 >
2021 10-03 RStudio|用R Markdown生成你的R语言数据分析报告 R Markadown 作为一款通过R语言创建动态文档的写作排版工具,为数据科学提供了现成的写作框架。通过 R Markdown 不仅可以运行和保存R代码,还可以生成高质量的数据分析报告并以HTML、PDF或者word的形式分享。1,get started很早就对R语言可以制作高质量的报告有所耳闻,但也没有很强的意愿去研究一番。究其缘由在于写公众号时无法不会优雅的插入代码块,便有意...阅读全文&... 阅 读 全 部 >
2021 10-01 【教程】Rmarkdown使用简易教程 1 如何用Rmarkdown生成中文自动化报告?本文总结Rmarkdown的使用,主要回答以下问题:Rmarkdown是什么?如何使用Rmarkdown?如何使用Rmarkdown生成中文文档?Rmarkdown应用举例?Rmarkdown是什么?Analyze. Share. Reproduce.Your data tel...阅读全文>>... 阅 读 全 部 >
2021 09-29 R知识速查表,值得收藏 编者按:R知识速查表囊括R基本知识,R高级知识,R数据导入,R数据可视化,R数据处理,字符串处理,正则表达式,日期时间处理,数据转换和机器学习。对于R新手,建议按着这个顺序学习和实践。【温馨提示:点击图片,可查看大图】一:基本 R 知识二:高级R知识三:数据可视化知识四:数据导入知识五:数据处理知识六:数据转换知识七:字符串处理知识八:正则表达式知识九:日期时间处理十:机器学习知识参考资料:...... 阅 读 全 部 >
2021 09-17 学习R语言,一篇文章让你从懵圈到入门 在实际工作中,每个数据科学项目各不相同,但基本都遵循一定的通用流程。具体如下:数据科学工作流程数据导入数据整理反复理解数据数据可视化数据转换统计建模作出推断(比如预测)沟通交流自动化分析程序开发下面列出每个步骤最有用的一些R包:数据导入以下R包主要用于数据导入和保存数据feather:一种快速,轻量级的文件格式。在R和python上都可使用readr:实现表格数据的快...阅读全文>>... 阅 读 全 部 >