2022 06-04 30天学会R DAY6: 数据导入导出及描述 一、 工作空间工作空间,意味着,所有R的程序文件、数据集、其他相关资料都保存在某一个文件夹下面,十分方便提取。在一个R语言程序结束后,工作空间可以保存它的映像,在下次启动R时,该工作空间,包括历史代码就会自动重新加,非常方便。但没次使用的包需要重新加载。1.设置工作空间方法一,采用setwd()语句,设置工作空间,设置的文件夹需事先在硬盘中建立,R语言无法创建新的文件夹。...阅读全文>&g... 阅 读 全 部 >
2022 06-03 30天学会R DAY5: R语言对象的操作总结 R语言主要分析的对象是数据集,R语言数据集主要是向量、矩阵、数据框、列表、数组等,我们主要介绍前4种。前面2文已经进行了4种对象的介绍,现在本文将4种对象的程序方法进行进一步总结和凝练。一、is和as系列函数is 和as系列函数涉及不同类型数据和对象的鉴定和转换。我们经常在R语言编程过程中需要了解某一种数据的类型,也可能进行转换方便计算,所以诸位要熟悉他们。is系列是判断某一个...阅读全文>... 阅 读 全 部 >
2022 06-03 30 天学会R DAY 15:tidyr包,数据整理另外一个利器 tidyr包 用来处理宽数据和长数据,用来进行字符串变量的拆分和合并,在医学大数据领域用的较多,有兴趣的朋友可以了解下。本文将演示tidyr包中下述四个函数的用法:1. gather—宽数据转为长数据。2. spread—长数据转为宽数据。3. unit—多列合并为一列4. separate—将一列分离为多列tidyr包安装及载入i...阅读全文>>... 阅 读 全 部 >
2022 06-03 R语言数据清洗之数据排排坐:轻松实现脏数据的预处理! 俱往矣,数风流人物,还看今朝!从今天开始,R语言数据清洗或者叫做数据预处理的大幕正式拉开!众所周知,在现实工作中,我们面临的几乎所有数据都是脏数据,即乱七八糟的数据,要让这些数据发挥价值,就必须要对其进行整理、修饰,让其变成一个软件可接受,可识别的整洁数据。当然了,100个数据科学家就会有98个说,数据清洗最费时间费脑子。这是可想而知的,因为数据的读取与分析这都是固定的套路,唯有数据的清洗不固定,... 阅 读 全 部 >
2022 06-03 R语言数据处理方法~小结 文章目录1. R自带函数2. reshape2数据重构3. dplyr4. tidyr5. 字符串处理1. R自带函数1.1 转置使用函数t()可对一个矩阵或数据框进行转置,对于数据框,行名将变成变量(列)名。数列array进行维度转换 aperm1.2 整合数据aggregate在R中使用一个或多个by变量和一个预先定义好的函数来折叠(collapse)数据。调用格式为:其中x是待折叠的数据对象... 阅 读 全 部 >
2022 06-03 在线绘制PCA图和Heatmap,一键出图 主成分分析(PCA),是考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。图1 主成分分析得分图在生物医学领域,生物样本存在于一个复杂的系统,容易受各种环境因素及自身基因、代谢等因素的影响,变量非常多。PCA可以从复杂的数据中找到最主要的元素,去除...阅读全文>... 阅 读 全 部 >
2022 06-03 SCI论文返修稿网上提交过程,以ScholarOne投稿系统为例 投稿系统网页顶部内容,登录个人账号即可查看。以完成所有内容提交后的确认界面内容开始, Step7:Review & SubmitStep 1:view and Respond to Decision Letter 进行确认Step 2:Type, Title, & Abstract 进行确认Step 3:Attributes(定语/属性,即关键词) 进行确认S...阅读全文>... 阅 读 全 部 >
2022 06-03 技能|如何做出高颜值的SCI论文配图? 不少科研工作者,包括在读的博士生、研究生等可能都有这样的体会:千辛万苦得来的实验结果,不知道该如何展现给别人?曾经有位论文审稿人在自己的博文中就写道:“我审稿时看稿件的顺序是题目、摘要、图表、前言、参考文献和正文”。可见论文中图片的质量是非常重要的,处理一张图可能会花费大量的时间,图片质量的好坏一定程度上决定了论文能否被录用。而反过来,仔细分析大牛们的文章,不难发现,这些...阅读全文>&g... 阅 读 全 部 >
2022 06-03 标签糊成一坨?如何为图表添加“帅帅”的指引线? 在Seurat的输出结果中,有一个展示表达量变化最大10个基因的图表令人印象深刻,如下图。关于该图表的具体内容参考之前 《单细胞转录组学习笔记之Seurat 3.0(一)》 一文。那么,常规散点图能不能画成这样效果? 如果仍然使用针对单细胞数据高度定制的Seurat,显然是非常麻烦的。而使用ggplot2绘制类似这样的多标签图表,又容易出现“数据标签重叠”、超出绘图区域的标签“显示不全“和邻近数据... 阅 读 全 部 >
2022 06-03 玉米RNA-seq测序数据差异基因分析 huanying今天给大家分享一个非常棒的玉米转录组的流程分析。原文作者是cxge,首发于omicshare论坛,阅读原文可跳转至本文的帖子哦~软件及参考基因组BWA, Samtools, Hisat2, HTseq, gffcompare, Stringtie, Ballgown,RB73-V3, B73-V4(Enzampl database)流程protocol首先从原始...阅读全文>... 阅 读 全 部 >