2022 06-03 30 天学会R DAY 15:tidyr包,数据整理另外一个利器 tidyr包 用来处理宽数据和长数据,用来进行字符串变量的拆分和合并,在医学大数据领域用的较多,有兴趣的朋友可以了解下。本文将演示tidyr包中下述四个函数的用法:1. gather—宽数据转为长数据。2. spread—长数据转为宽数据。3. unit—多列合并为一列4. separate—将一列分离为多列tidyr包安装及载入i...阅读全文>>... 阅 读 全 部 >
2022 06-03 R语言数据清洗之数据排排坐:轻松实现脏数据的预处理! 俱往矣,数风流人物,还看今朝!从今天开始,R语言数据清洗或者叫做数据预处理的大幕正式拉开!众所周知,在现实工作中,我们面临的几乎所有数据都是脏数据,即乱七八糟的数据,要让这些数据发挥价值,就必须要对其进行整理、修饰,让其变成一个软件可接受,可识别的整洁数据。当然了,100个数据科学家就会有98个说,数据清洗最费时间费脑子。这是可想而知的,因为数据的读取与分析这都是固定的套路,唯有数据的清洗不固定,... 阅 读 全 部 >
2022 06-03 R语言数据处理方法~小结 文章目录1. R自带函数2. reshape2数据重构3. dplyr4. tidyr5. 字符串处理1. R自带函数1.1 转置使用函数t()可对一个矩阵或数据框进行转置,对于数据框,行名将变成变量(列)名。数列array进行维度转换 aperm1.2 整合数据aggregate在R中使用一个或多个by变量和一个预先定义好的函数来折叠(collapse)数据。调用格式为:其中x是待折叠的数据对象... 阅 读 全 部 >
2022 06-03 在线绘制PCA图和Heatmap,一键出图 主成分分析(PCA),是考察多个变量间相关性的一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关。图1 主成分分析得分图在生物医学领域,生物样本存在于一个复杂的系统,容易受各种环境因素及自身基因、代谢等因素的影响,变量非常多。PCA可以从复杂的数据中找到最主要的元素,去除...阅读全文>... 阅 读 全 部 >
2022 06-03 技能|如何做出高颜值的SCI论文配图? 不少科研工作者,包括在读的博士生、研究生等可能都有这样的体会:千辛万苦得来的实验结果,不知道该如何展现给别人?曾经有位论文审稿人在自己的博文中就写道:“我审稿时看稿件的顺序是题目、摘要、图表、前言、参考文献和正文”。可见论文中图片的质量是非常重要的,处理一张图可能会花费大量的时间,图片质量的好坏一定程度上决定了论文能否被录用。而反过来,仔细分析大牛们的文章,不难发现,这些...阅读全文>&g... 阅 读 全 部 >
2022 06-03 标签糊成一坨?如何为图表添加“帅帅”的指引线? 在Seurat的输出结果中,有一个展示表达量变化最大10个基因的图表令人印象深刻,如下图。关于该图表的具体内容参考之前 《单细胞转录组学习笔记之Seurat 3.0(一)》 一文。那么,常规散点图能不能画成这样效果? 如果仍然使用针对单细胞数据高度定制的Seurat,显然是非常麻烦的。而使用ggplot2绘制类似这样的多标签图表,又容易出现“数据标签重叠”、超出绘图区域的标签“显示不全“和邻近数据... 阅 读 全 部 >
2022 06-03 玉米RNA-seq测序数据差异基因分析 huanying今天给大家分享一个非常棒的玉米转录组的流程分析。原文作者是cxge,首发于omicshare论坛,阅读原文可跳转至本文的帖子哦~软件及参考基因组BWA, Samtools, Hisat2, HTseq, gffcompare, Stringtie, Ballgown,RB73-V3, B73-V4(Enzampl database)流程protocol首先从原始...阅读全文>... 阅 读 全 部 >
2022 06-02 30 天学会R DAY 14:R语言必学包dplyr R语言非常讲究数据的整理,我们在7-13天的R语言学习内容中,着重都是关于R语言的整理,各种方法对数据进行整理,查看,对变量进行转换。dplyr包,主要也用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度。这个包对数据处理的方式相对之前的方法,更加简单,是医学数据分析必须要掌握的包。dplyr包存在着上百个函数来帮助进行数据的整理,由于篇幅的关系,本...阅读全文&... 阅 读 全 部 >
2022 06-02 甲基化分析实战,将你的数据用在刀刃上! 2020年4分+甲基化生信文章复现领悟生信文章逻辑之美,小伙伴们大家好呀,我是风间琉璃。上一周我们品读了2020年10月发表在《Frontiers in oncology》杂志上的文章“ A Novel Promoter CpG-Based Signature for Long-Term Survival Prediction of Breast Cancer Patients”。作者使用CHAM... 阅 读 全 部 >
2022 06-02 国自然基金申报书万能模板鉴赏,春交标书帮你先点评 新年第一问,你的标书写好了咩!!!马上3月20号就要结束申报了标书写的如何呢看大家过年都在埋头写写完我帮你看看吧临阵磨枪不亮也光赶在Deadline前交标书可以在联系小助理哦(*^__^*)以下是国自然申报书写万能模板 (来源网络) 报告正文A(一)立项依据与研究内容1、项目的立项依据XXX疾病及其研究进展XXXX疾...阅读全文>>... 阅 读 全 部 >