2022 06-03 30 天学会R DAY 15:tidyr包,数据整理另外一个利器 tidyr包 用来处理宽数据和长数据,用来进行字符串变量的拆分和合并,在医学大数据领域用的较多,有兴趣的朋友可以了解下。本文将演示tidyr包中下述四个函数的用法:1. gather—宽数据转为长数据。2. spread—长数据转为宽数据。3. unit—多列合并为一列4. separate—将一列分离为多列tidyr包安装及载入i...阅读全文>>... 阅 读 全 部 >
2022 06-03 R语言数据清洗之数据排排坐:轻松实现脏数据的预处理! 俱往矣,数风流人物,还看今朝!从今天开始,R语言数据清洗或者叫做数据预处理的大幕正式拉开!众所周知,在现实工作中,我们面临的几乎所有数据都是脏数据,即乱七八糟的数据,要让这些数据发挥价值,就必须要对其进行整理、修饰,让其变成一个软件可接受,可识别的整洁数据。当然了,100个数据科学家就会有98个说,数据清洗最费时间费脑子。这是可想而知的,因为数据的读取与分析这都是固定的套路,唯有数据的清洗不固定,... 阅 读 全 部 >
2022 06-03 R语言数据处理方法~小结 文章目录1. R自带函数2. reshape2数据重构3. dplyr4. tidyr5. 字符串处理1. R自带函数1.1 转置使用函数t()可对一个矩阵或数据框进行转置,对于数据框,行名将变成变量(列)名。数列array进行维度转换 aperm1.2 整合数据aggregate在R中使用一个或多个by变量和一个预先定义好的函数来折叠(collapse)数据。调用格式为:其中x是待折叠的数据对象... 阅 读 全 部 >
2022 06-03 在线绘制PCA图和Heatmap,一键出图 主成分分析(PCA),是考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。图1 主成分分析得分图在生物医学领域,生物样本存在于一个复杂的系统,容易受各种环境因素及自身基因、代谢等因素的影响,变量非常多。PCA可以从复杂的数据中找到最主要的元素,去除...阅读全文>... 阅 读 全 部 >
2022 06-03 SCI论文返修稿网上提交过程,以ScholarOne投稿系统为例 投稿系统网页顶部内容,登录个人账号即可查看。以完成所有内容提交后的确认界面内容开始, Step7:Review & SubmitStep 1:view and Respond to Decision Letter 进行确认Step 2:Type, Title, & Abstract 进行确认Step 3:Attributes(定语/属性,即关键词) 进行确认S...阅读全文>... 阅 读 全 部 >
2022 06-03 技能|如何做出高颜值的SCI论文配图? 不少科研工作者,包括在读的博士生、研究生等可能都有这样的体会:千辛万苦得来的实验结果,不知道该如何展现给别人?曾经有位论文审稿人在自己的博文中就写道:“我审稿时看稿件的顺序是题目、摘要、图表、前言、参考文献和正文”。可见论文中图片的质量是非常重要的,处理一张图可能会花费大量的时间,图片质量的好坏一定程度上决定了论文能否被录用。而反过来,仔细分析大牛们的文章,不难发现,这些...阅读全文>&g... 阅 读 全 部 >
2022 06-03 标签糊成一坨?如何为图表添加“帅帅”的指引线? 在Seurat的输出结果中,有一个展示表达量变化最大10个基因的图表令人印象深刻,如下图。关于该图表的具体内容参考之前 《单细胞转录组学习笔记之Seurat 3.0(一)》 一文。那么,常规散点图能不能画成这样效果? 如果仍然使用针对单细胞数据高度定制的Seurat,显然是非常麻烦的。而使用ggplot2绘制类似这样的多标签图表,又容易出现“数据标签重叠”、超出绘图区域的标签“显示不全“和邻近数据... 阅 读 全 部 >
2022 06-03 玉米RNA-seq测序数据差异基因分析 huanying今天给大家分享一个非常棒的玉米转录组的流程分析。原文作者是cxge,首发于omicshare论坛,阅读原文可跳转至本文的帖子哦~软件及参考基因组BWA, Samtools, Hisat2, HTseq, gffcompare, Stringtie, Ballgown,RB73-V3, B73-V4(Enzampl database)流程protocol首先从原始...阅读全文>... 阅 读 全 部 >
2022 06-02 30 天学会R DAY 14:R语言必学包dplyr R语言非常讲究数据的整理,我们在7-13天的R语言学习内容中,着重都是关于R语言的整理,各种方法对数据进行整理,查看,对变量进行转换。dplyr包,主要也用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度。这个包对数据处理的方式相对之前的方法,更加简单,是医学数据分析必须要掌握的包。dplyr包存在着上百个函数来帮助进行数据的整理,由于篇幅的关系,本...阅读全文&... 阅 读 全 部 >
2022 06-02 shiny动态仪表盘应用——中国世界自然文化遗产可视化案例 这一篇很早就想写了,一直拖到现在都没写完。虽然最近的社交网络上娱乐新闻热点特别多,想用来做可视化分析的素材简直多到不可想象,但是我个人一向不追星,对明星热文和娱乐类的新闻兴趣不是很大。还是更愿意把自己的精力贡献在那些不起眼的,然而却更能触动我们心灵与文化内涵的素材上来。今天要写的主题中国的世界遗产名录,我将使用简单的网络数据抓取,多角度呈现我国当前已经拥有的世界遗产名录数目、类别、地域分布、详情介... 阅 读 全 部 >