2023 01-01 ATAC-Seq分析教程:用网页版工具做功能分析和motif分析—科研必备表观遗传学知识 ATAC-Seq分析教程系列ATAC-Seq分析教程:ATAC-seq的背景介绍以及与ChIP-Seq的异同ATAC-Seq分析教程:原始数据的质控、比对和过滤ATAC-Seq分析教程:用MACS2软件call peaksATAC-Seq分析教程:对ATAC-Seq/ChIP-seq的质量评估(一)phantompeakqualtoo...阅读全文>>... 阅 读 全 部 >
2022 11-16 小RNA丰度条形图的绘制(R语言) 小RNA中的丰度分布十分不均,少数种类小RNA的丰度占全部的比例较高,研究重点也都放在丰度较高的小RNA上,小RNA长度分布图可以有效筛选丰度较高的小RNA,我们以文献“Characterization of mouse serum exosomal small RNA content: The origins and their roles in modulating inflammato...... 阅 读 全 部 >
2022 10-03 深度丨高通量测序数据格式演化简史-nfo文件 关键词:测序技术、序列格式、数据质控 阅读用时:全文共6小节,约4800字,约9分钟 关键词:测序技术、序列格式、数据质控 作为一名生信老鸟,深知一入生信深似海。俗话说,不了解数据格式的程序猿不是好科研工作者,今天我们就聊聊随着高通量测序技术的发展,不同测序原理、不同测序仪的的原始下机文件格式都有哪些,走过了怎样的发展演化史?2005年454公司的 Genome Seque...阅读全文>... 阅 读 全 部 >
2022 08-21 小白R语言数据可视化进阶练习一 作者:路遥马亡R语言中文社区专栏作者知乎ID:https://zhuanlan.zhihu.com/c_13540979700布局参数先介绍一个布局参数:#par(mfrow=c(a,b)) #表示在PLOTS区域显示a行b列张图 par(mfrow=c(3,1)) x <- rnorm(100) y <- rnorm(100) plot(x, y, xlim=c(-5,5),...阅... 阅 读 全 部 >
2022 08-21 用R语言把数据玩出花样 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网…都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域。让我们一起动起来吧,开始R的极客...阅... 阅 读 全 部 >
2022 08-21 ggplot2学习笔记系列之利用ggplot2绘制误差棒及显著性标记 taoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/公众号:生信大课堂绘制带有误差棒的条形图library(ggplot2)#创建数据集df <- data.frame(treatment = factor(c(1, 1, 1, 2, 2, 2, 3, 3, 3)),response = c(2, 5, 4, 6, 9, 7, 3, 5... 阅 读 全 部 >
2022 08-20 新一代配色R包,还不赶快升级你的配色方案? 当我开始使用R时,像任何初学者一样,我想要一个真正能够工作的代码和一个最低限度可理解的图像,并且很长一段时间这是我的主要目标,但是一旦这一点完成后,我意识到我的可视化看起来很糟糕,特别是在比较和审查其他博客和网站之后,我开始搜索如何改进我的可视化。下面,创建一个简单且专业的图像的一些技巧,以吸引读者的注意力。01 创建可视化让我们开始一个简单的可视化,来自diamonds数据集的直方图。1.1 包... 阅 读 全 部 >
2022 08-19 PCA、LDA、MDS、LLE、TSNE等降维算法的Python实现 整理 | 夕颜【导读】网上关于各种降维算法的资料参差不齐,但大部分不提供源代码。近日,有人在 GitHub 上整理了一些经典降维算法的 Demo(Python)集合,同时给出了参考资料的链接。PCA资料链接:https://blog.csdn.net/u013719780/article/details/78352262https://blog.csdn.net/u013719780/articl... 阅 读 全 部 >
2022 08-19 R语言从入门到精通:Day14(PCA & tSNE) 实际工作中要处理的变量之间的关系往往是错综复杂的。处理这些多变量数据的最大挑战之一就是信息过度复杂,若数据集有100个变量,如何了解其中所有的交互关系呢?即使只有20个变量,当试图理解各个变量与其他变量的关系时,也需要考虑190对相互关系。主成分分析等方法是用来探索和简化多变量复杂关系的常用方法。在这里我们重点介绍两种简化多变量复杂关系,即降维的方法:主成分分析和t-SNE(t-Distri...... 阅 读 全 部 >
2022 08-18 小学生都看得懂之 白话数据降维 据降维是数据分析中最常用到的一种技术了,这篇小文将试图用大白话讲一讲数据降维到底是什么,有什么用,常用的方法分别是什么?希望写的让小学生也能听懂,下面先为各位奉上这篇小文的思维导图。这篇文章贯穿始终的一个故事场景是如何在一个小镇上将横纵的街道编号,例如科技三路和凤城五路的接口这样一个用俩个数字标注的位置信息,转化更一个只用一个数字标识的位置描述。在上述的例子中,原来的位置信息有俩个维度,...阅读... 阅 读 全 部 >