2022 11-18 用R语言爬取川普twitter进行数据分析 Twitter是一个流行的社交网络,这里有大量的数据等着我们分析。Twitter R包是对twitter数据进行文本挖掘的好工具。 本文是关于如何使用Twitter R包获取twitter数据并将其导入R,然后对它进行一些有趣的数据分析。第一步是注册一个你的应用程序。为了能够访问Twitter数据编程,我们需要创建一个与Twitter的API交互的应用程序。注册后你将收到一个...阅读全文>... 阅 读 全 部 >
2022 06-04 30 天学会R DAY 11:条件和循环语句的应用 在所有计算机语言中,条件和循环语句占据着极其重要的地位,在统计软件比如SAS,条件语句在数据整理中的地位也举足轻重。R语言高级编程,条件和循环语句也类似如此。作为初级教程,今天我们就两语句在数据整理做简单的介绍。一、条件语句条件语句,最常见的是 if语句。If语句常见的形式有简单的ifelse 语句 和复杂的if –else if-else语句1. ifelse 语句...阅读全文>>... 阅 读 全 部 >
2022 06-03 标签糊成一坨?如何为图表添加“帅帅”的指引线? 在Seurat的输出结果中,有一个展示表达量变化最大10个基因的图表令人印象深刻,如下图。关于该图表的具体内容参考之前 《单细胞转录组学习笔记之Seurat 3.0(一)》 一文。那么,常规散点图能不能画成这样效果? 如果仍然使用针对单细胞数据高度定制的Seurat,显然是非常麻烦的。而使用ggplot2绘制类似这样的多标签图表,又容易出现“数据标签重叠”、超出绘图区域的标签“显示不全“和邻近数据... 阅 读 全 部 >
2022 05-02 分析数据时你可能遇到一些奇奇怪怪的符号…… 在分析数据的时候,不管是数据表格中还是脚本中经常会出现一些奇奇怪怪的符号。这些符号中有些符号用法简单,而另一些符号功能特别强大。下面就以R语言为例,为大家整理一下常见符号的功能用法。NaN“Not a Number”的缩写,非数值,NaN参与运算时返回NaN。a <- 0/0a#[1] NaNa+1#[1] NaNNA“Not available”的缩写...阅读全文>>... 阅 读 全 部 >
2022 05-01 Volcano plot | 别再问我这为什么是火山图 (在线轻松绘制) 封面来源于:Pixabay+易生信生物信息学习的正确姿势NGS系列文章包括、 高颜值在线绘图和分析 、转录组分析 )、ChIP-seq分析 ()、单细胞测序分析 ()、DNA甲基化分析、重测序分析、GEO数据挖掘() 、 批次效应处理 等内容 。所以关注火山图(其它类型图也是),先理解 每个点是什么 (点代表基因、样品、通路或其它的,这个认识可以来自于常识,更准确的是看作者的描述),然后...阅读... 阅 读 全 部 >
2022 05-01 图说转录组——啥也别说,你要的都在图里了! 转录组作为研究分子机制最常用的科研手段,几乎每个科研工作者都会与它有那么一两段缘分,今天就带大家一起来通过图说的形式,了解下转录组结果中的重点分析内容,闲话不多说,上干货!图说一、 生物学重复平行性检验-相关性分析热图+PCA图转录组测序目前普遍要求进行检测的每个组别,是少需要三个生物学重复,以保证结果的科学性。生物学重复的平行性越好,重复作为一个组呈现时,分析的结果越可靠,因此,...阅读全文&... 阅 读 全 部 >
2022 04-30 几行R语言代码即可绘制火山图? 火山图(volcano plot)常用于显著差异基因表达的展示,包含显著和差异两个重要信息。显著性指P值小于0.05,差异性常用FoldChange值>=2作为筛选标准。那么如何看懂一张火山图所包含的信息呢?首先需要知道,火山图的横坐标通常用log2(fold change)表示,差异越大的基因分布在两端,纵坐标用-log10(pvalue)表示,T检验显著性P值的负对数...阅读全文>... 阅 读 全 部 >
2021 10-05 R Markdown:可能是你数据分析报告最好的解决方案 为什么要用Rmd?“如果你是第一次听到R Markdown这个名词的话,可能你会问R Markdown是什么?我们能用它来做什么?怎么使用R Markdown?且听小编跟你道来。”当初人才计划进行到第二阶段的时候,水妈要求我们所有的 R 代码都需要通过R Markdown生成html来提交。一开始并不了解其中奥义,在此之前印象中那只是一个可以用来生成数据分析文件格式的工具。经过一段时间学...阅读... 阅 读 全 部 >
2021 07-26 RNA-seq数据分析流程详解 如果大家想要了解测序原理,参考文章( 测序产生了那么多数据,你知道测序的原理吗? ); 如果大家想要了解测序数据格式,参考文章()本文介绍RNA-seq的具体分析流程。1、cutadapt去接头我们拿到的测序数据一般是带有接头的fastq格式文件,需要用cutadapt把接头去掉。具体代码如下:#cut NAT sample#-u 20(正值u表示切除R1的前20个碱基) -u -30(负值u表示... 阅 读 全 部 >
2021 03-15 PPT数据分析报告实战课程 课程介绍 适合需提升竞争力、提升工作效率、喜欢用数据说话的职场人士,如从事产品、运营、市场、财务、人事、分析等。学数据分析--主要介绍数据分析报告分析思路构建、图表展现、结论撰写、PPT报告排版方面实战方法与技巧。 学习地址 百度:https://pan.baidu.com/s/1HFo0i4EilE32XV3OFkU7YA 天翼:https://cloud... 阅 读 全 部 >