2022 06-27 几种常见的数据标准化的方法总结! 一、标准化在进行数据分析时,数据具有单位是非常常见的,比如说GDP可以以亿作为单元,也可以以百万作为单位,那么此时就会出现由于单位问题导致的数字大小问题;这种情况对于分析可能产生影响,因此需要对其进行处理,但是处理的前提是不能失去数字的相对意义,即之前数字越大代表GDP越高,处理后的数据也不能失去这个特性。也或者计算距离,数字1和2的距离可以直接相减得到距离值为1; 另外一组数...阅读全文>... 阅 读 全 部 >
2022 06-26 3分钟搞定GO/KEGG富集分析 在进行差异基因表达分析时,得到显著差异基因后,接下来就需要分析这些基因参与了哪些功能,常见的就是GO功能注释和KEGG通路富集分析,今天为大家介绍在线分析工具的使用——DAVID与KOBAS 3.0。DAVID是一个生物信息数据库,其整合了生物学数据和分析工具,为大规模的基因或蛋白列表提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。目前DAVID数据库主要用于差异基因的功能和通路...... 阅 读 全 部 >
2022 06-23 R语言爬虫系列5|正则表达式与字符串处理函数 作者:鲁伟,热爱数据,坚信数据技术和代码改变世界。R语言和Python的忠实拥趸,为成为一名未来的数据科学家而奋斗终生。个人公众号:数据科学家养成记 (微信ID:louwill12)第三篇戳:R语言爬虫系列3|HTTP协议无论是R中的RCurl组件还是Python的BeautifulSoup库,对网页HTML完成下载解析之后我们从这些看似杂乱无章的文本中拿到我们感兴趣的数据。之前在系列2的时候小编... 阅 读 全 部 >
2022 06-23 R语言实战—简单数据分析 作者:Carson 数据分析师,R语言中文社区专栏作者。知乎专栏:https://zhuanlan.zhihu.com/carson-0814数据源:朝阳医院2016年销售数据分析指标:1、月均消费次数;2、月均消费金额;3、客单价;4、消费趋势打开excel数据源,数据的基本字段如下:一、将excel数据源导入R中二、对数据进行预处理“数据是一件麻烦的事——一件非常非常麻烦的事。”,数据分析工作... 阅 读 全 部 >
2022 06-23 10个令人相见恨晚的R语言包 作者:yhat大约3年前我开始使用R,起初进展很慢,与我习惯的语言相比,语法更加直观也比较简单,而且需要一段时间才能习惯于细微的差别。我还不清楚语言的力量与社区和各种包的密切关系。和其他语言(比如Python和Java)相比,R可以更模糊和麻烦。好消息是,有大量的包可以在R基础库上提供简单和熟悉的界面。这篇文章是我喜欢和每天使用的10个包,并且我希望自己能早些知道他们。...阅读全文>>... 阅 读 全 部 >
2022 06-22 如何做GO与KEGG分析-DAVID使用教程 这期番茄君为大家带来如何利用DAVID在线数据库做GO与KEGG分析。1.点击文末“阅读全文”,获取DAVID在线数据库网址链接。打开后如下(部分):2.点击上图中红色框里的Start Analysis。如下: 3.上传基因。Step1: Enter Gene List有两个选项可以上传基因:第一种方法是在A: Paste a list的白色框里输入基因名字;第二种方法是利用B:Choose ..... 阅 读 全 部 >
2022 06-22 手把手教你使用R语言做评分卡模型 作者介绍:黄升,普兰金融数据分析师,从事数据分析相关工作,擅长R语言,热爱统计和挖掘建模。目录使用Logistic和NaiveBayes建模Score Card原理Naive Bayes评分卡Logistics评分卡前言信用评分是指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分...阅读全文>>... 阅 读 全 部 >
2022 06-18 目前最全的R语言-图片的组合与拼接 作者:李誉辉四川大学在读研究生 前言这篇是作者总结的目前最全的R语言—图片组合和拼接,当然常言道:百密必有一疏,欢迎大家在评论区留言本篇没有总结到的用于图片组合和拼接的R包。做教程狠费精力的,别忘了点赞和转发。谢谢。1customLayout包参考来源:https://www.rdocumentation.org/packages/customLayout/versions/0.2.0htt...... 阅 读 全 部 >
2022 06-17 R语言绘图课程 | PCA图 PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。在生物信息分析中,PCA常用于分析不同样本之间的相互关系,可以基于表达量或者SNP突变类型进行分析。R语言是一门专门针对统计绘图等需求设计的编程语言,在R语言中,内置了PCA分析的函数prco..... 阅 读 全 部 >
2022 06-15 一文读懂PCA分析 (原理、算法、解释和可视化) library(knitr)library(psych)library(reshape2)library(ggplot2)library(ggbeeswarm)library(scatterplot3d)library(useful)library(ggfortify)mat_show <- functio...阅读全文>>... 阅 读 全 部 >