2022 06-23 R语言也能玩ps?magick包你值得拥有 作者:鲁伟,热爱数据,坚信数据技术和代码改变世界。R语言和Python的忠实拥趸,为成为一名未来的数据科学家而奋斗终生。个人公众号:数据科学家养成记 (微信ID:louwill12)今天要给大家介绍的是2017年的一款新包——magick包。可能大家看到推文题目也都知道了,这是一款图片与图像处理的扩展包,以后ps能做的R语言一定程度上也可以做啦。毕竟从大数据的角度来讲,图片图像数据也是数据嘛。话不... 阅 读 全 部 >
2022 06-23 【R语言】教你使用常用的字符串处理方法 在字符串处理中经常会使用到正则表达式,例如从HTML源码中或事件日志中获取目标数据,一般可以通过正则表达式完成任务。在我看来,所谓正则表达式就是根据字符串中的规律书写的一种表达式,关键点是发现规律。根据我的工作应用场景,字符串处理中最为常见的四种手段有“拆、替、抽、取”,具体来讲就是:拆:将字符串按照某个分隔符切割开来例如,邮箱“[email protected]”,我想把邮箱的地...阅读全文&... 阅 读 全 部 >
2022 06-23 R语言实战—简单数据分析 作者:Carson 数据分析师,R语言中文社区专栏作者。知乎专栏:https://zhuanlan.zhihu.com/carson-0814数据源:朝阳医院2016年销售数据分析指标:1、月均消费次数;2、月均消费金额;3、客单价;4、消费趋势打开excel数据源,数据的基本字段如下:一、将excel数据源导入R中二、对数据进行预处理“数据是一件麻烦的事——一件非常非常麻烦的事。”,数据分析工作... 阅 读 全 部 >
2022 06-23 10个令人相见恨晚的R语言包 作者:yhat大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。和其他语言(比如Python和Java)相比,R可以更模糊和麻烦。好消息是,有大量的包可以在R基础库上提供简单和熟悉的界面。这篇文章是我喜欢和每天使用的10个包,并且我希望自己能早些知道他们。...阅读全文>>... 阅 读 全 部 >
2022 06-23 R数据处理|基础篇(二) 先用几个问题检验一下你是否需要看这篇文章dplyr包中如何批量筛选变量做汇总计算,知不知道有summarise_all at 这类函数reshape2包中的融合重铸和分组计算有什么关联tidyr 包的使用Hadley 大神本文介绍数据处理上的其他方面,和上一篇文章合在一起就可以组成处理数据的一个完整的系统。本文目录如下...阅读全文>>... 阅 读 全 部 >
2022 06-23 爱它就挖掘出它的最后价值:一个R包的全方位使用手册 之前介绍了如何通过使用GDCRNATools这个包构建ceRNA网络,可以说整个过程非常简单和明了,对于我们学医的小朋友来讲,是个极好用的工具。但是这个包除了构建网络以外,还有很多附加的功能。要知道一篇ceRNA的文章,不单单只有那张网络图而已,还需要其他内容进行修饰和填充。那我们来看看这个包到底还有哪些功能?前两期链接:一这三条代码产生了下面几张图,具体就不解释了,一看就知道哈二输入上述的代码,... 阅 读 全 部 >
2022 06-23 快速拿捏KEGG/GO/Reactome/Do/MSigDB的GSEA富集分析! 通过KEGG、GO等经典富集分析,我们能够了解到阈值筛选出的差异基因参与的通路和具备的功能,以及哪些功能/通路对表型变化是可能起主导作用的。但在经典富集分析中,我们无法得知某条通路下差异基因的总体变化趋势,即富集到同一通路下的基因既又上调也有下调,那么这条通路的表现形式到底是被激活了呢?还是被抑制了呢?且设定的阈值可能也会卡掉一些在统计学意义上无显著差异但实则有着重要生物学意义的基因,导致重要通路... 阅 读 全 部 >
2022 06-23 用clusterProfiler做GO、KEGG富集分析 寻找差异表达的基因并识别它们的功能,是我们进行RNA测序的最主要目的。很明显,这些差异的基因必然与功能改变密切相关,例如,比较患病个体与正常个体的组织表达谱,不难想到这些显著失调的基因参与了生物学过程、信号通路等,导致了疾病的发生。前面已经讲了如何使用DESeq2、edgeR基于转录组测序获得的基因表达值鉴定差异表达基因。那么,后续如何继续通过生信分析的方法,探索差异表达的基因发挥...阅读全文&... 阅 读 全 部 >
2022 06-23 GO富集分析(R包GOseq) 前面已经讲述了R包用clusterProfiler做GO富集分析clusterProfiler的GO富集分析方法,本篇继续演示R包goseq的GO富集分析。相比clusterProfiler中的GO富集分析方法,goseq的特别之处在于,不再使用超几何分布(Hyper-geometric distribution)检验,而是使用了Wallenius non-central hype...阅读全文&... 阅 读 全 部 >
2022 06-22 如何做GO与KEGG分析-DAVID使用教程 这期番茄君为大家带来如何利用DAVID在线数据库做GO与KEGG分析。1.点击文末“阅读全文”,获取DAVID在线数据库网址链接。打开后如下(部分):2.点击上图中红色框里的Start Analysis。如下: 3.上传基因。Step1: Enter Gene List有两个选项可以上传基因:第一种方法是在A: Paste a list的白色框里输入基因名字;第二种方法是利用B:Choose ..... 阅 读 全 部 >