2021 10-16 使用dplyr进行数据操作(30个实例) dplyr软件包是R中功能最强大,最受欢迎的软件包之一。该软件包由最受欢迎的R程序员Hadley Wickham编写,他编写了许多有用的R软件包,如ggplot2,tidyr等。本文包括一些示例和如何使用使用dplyr软件包来清理和转换数据。这是一个关于数据操作和数据处理的完整教程。什么是dplyr?dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它...阅读全文>... 阅 读 全 部 >
2021 10-11 R语言网络爬虫初学者指南(使用rvest包) 引言网上的数据和信息无穷无尽,如今人人都用百度谷歌来作为获取知识,了解新鲜事物的首要信息源。所有的这些网上的信息都是直接可得的,而为了满足日益增长的数据需求,我坚信网络数据爬取已经是每个数据科学家的必备技能了。在本文的帮助下,你将会突破网络爬虫的技术壁垒,实现从不会到会。大部分网上呈现的信息都是以非结构化的格式存储(html)且不提供直接的下载链接,因此,我们需要学习一些知识和...阅读全文>... 阅 读 全 部 >
2021 10-09 我做数据分析工作常用的8个R包 文| R扫地僧1910字 | 6分钟阅读大家好,我是一名数据分析师,目前在一家互联网公司,做私域业务相关的数据分析工作。我经常会用R语言解决数据分析工作系列问题。在此,我分享下做数据分析工作常用的8个R包,也欢迎朋友们补充和分享自己常用的R包。1 dplyr包我用dplyr包做数据的整理工作,包括数据的选择(业务所需的行与列),变量的新增,数据的集成(常用的内连接和左连接),数据的聚合运算(描述性... 阅 读 全 部 >
2021 10-08 R语言对象的操作总结 现在本文将4种对象的程序方法进行进一步总结和凝练。一、is和as系列函数is 和as系列函数涉及不同类型数据和对象的鉴定和转换。我们经常在R语言编程过程中需要了解某一种数据的类型,也可能进行转换方便计算,所以诸位要熟悉他们。is系列是判断某一个数据中的观察值是何种类型,或者数据属于何种对象与结构• is.character(x) #判断是否为字符型• is.numer...阅读全文>>... 阅 读 全 部 >
2021 10-05 R Markdown:可能是你数据分析报告最好的解决方案 为什么要用Rmd?“如果你是第一次听到R Markdown这个名词的话,可能你会问R Markdown是什么?我们能用它来做什么?怎么使用R Markdown?且听小编跟你道来。”当初人才计划进行到第二阶段的时候,水妈要求我们所有的 R 代码都需要通过R Markdown生成html来提交。一开始并不了解其中奥义,在此之前印象中那只是一个可以用来生成数据分析文件格式的工具。经过一段时间学...阅读... 阅 读 全 部 >
2021 10-03 RStudio|用R Markdown生成你的R语言数据分析报告 R Markadown 作为一款通过R语言创建动态文档的写作排版工具,为数据科学提供了现成的写作框架。通过 R Markdown 不仅可以运行和保存R代码,还可以生成高质量的数据分析报告并以HTML、PDF或者word的形式分享。1,get started很早就对R语言可以制作高质量的报告有所耳闻,但也没有很强的意愿去研究一番。究其缘由在于写公众号时无法不会优雅的插入代码块,便有意...阅读全文&... 阅 读 全 部 >
2021 10-01 【教程】Rmarkdown使用简易教程 1 如何用Rmarkdown生成中文自动化报告?本文总结Rmarkdown的使用,主要回答以下问题:Rmarkdown是什么?如何使用Rmarkdown?如何使用Rmarkdown生成中文文档?Rmarkdown应用举例?Rmarkdown是什么?Analyze. Share. Reproduce.Your data tel...阅读全文>>... 阅 读 全 部 >
2021 09-29 R知识速查表,值得收藏 编者按:R知识速查表囊括R基本知识,R高级知识,R数据导入,R数据可视化,R数据处理,字符串处理,正则表达式,日期时间处理,数据转换和机器学习。对于R新手,建议按着这个顺序学习和实践。【温馨提示:点击图片,可查看大图】一:基本 R 知识二:高级R知识三:数据可视化知识四:数据导入知识五:数据处理知识六:数据转换知识七:字符串处理知识八:正则表达式知识九:日期时间处理十:机器学习知识参考资料:...... 阅 读 全 部 >
2021 09-21 FastQ & FastA傻傻分不清? 如果你对生物信息不那么了解,或许会搞混FASTQ和FASTA,它们都是序列保存的一种格式,是用于NGS分析的基础数据。其实二者很好区分,并且可以通过一定的处理进行格式转换。FASTQFASTQ:是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。你拿到的测序数据均是fastq格式的。其序列以及质量信息都是使用一个ASCII字符标示,最初是由Sanger开发,目的是将F...阅读... 阅 读 全 部 >
2021 09-17 学习R语言,一篇文章让你从懵圈到入门 在实际工作中,每个数据科学项目各不相同,但基本都遵循一定的通用流程。具体如下:数据科学工作流程数据导入数据整理反复理解数据数据可视化数据转换统计建模作出推断(比如预测)沟通交流自动化分析程序开发下面列出每个步骤最有用的一些R包:数据导入以下R包主要用于数据导入和保存数据feather:一种快速,轻量级的文件格式。在R和python上都可使用readr:实现表格数据的快...阅读全文>>... 阅 读 全 部 >