2022 08-29 R语言学习:行去重、时间处理、棒棒糖图、快捷键、模型可解释性 这一周R语言学习,记录如下。01行去重操作在一个实际数据项目,获取数据后,发现数据的行(样本)有重复,需要把重复行删除掉。dplyr包distinct函数,可以做行去重。# dplyr包library(dplyr)data <- data.frame(Column1 = c( 'P1', 'P1', 'P2', 'P3', 'P1'...阅读全文>>... 阅 读 全 部 >
2022 08-21 R语言学习:添加文本标签、流转分析漏斗图,聚合函数,EDA,雷达图,TidyX项目 这一周R语言学习,记录如下。01添加文本标签信息可视化时,通过文本标签对图形做标注,让图形更有效表达信息。以ggplot2包的条形图为例,使用geom_text()函数给条形图添加文本标签。library(ggplot2)set.seed( 123)data<- data.frame(x = sample(LETTERS[ 1: 6], 300, re...阅读全文>>... 阅 读 全 部 >
2022 08-21 用R语言把数据玩出花样 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网…都在使用R语言。要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域。让我们一起动起来吧,开始R的极客...阅... 阅 读 全 部 >
2022 08-19 还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码) 大数据文摘作品编译:寒小阳、蒋宝尚、Sheila、赖小娟、钱天培假设你有一个包含数百个特征(变量)的数据集,却对数据所属的领域几乎没有什么了解。 你需要去识别数据中的隐藏模式,探索和分析数据集。不仅如此,你还必须找出数据中是否存在模式--用以判定数据是有用信号还是噪音?这是否让你感到不知所措?当我第一次遇到这种情况,我简直全身发麻。想知道如何挖掘一个多维数据集? 这是许多数据科学家...阅读全文&... 阅 读 全 部 >
2022 08-15 LncRNA综述 一、研究背景lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,有文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的这些调控作用也开始引起人们广泛的关注。西班牙IMIM(Hospital del Mar Medical Research Institute)和加泰... 阅 读 全 部 >
2022 08-13 国自然热点:组蛋白修饰的10种研究思路(下篇) 组蛋白(histone)是真核生物体细胞染色质中的一种碱性蛋白质,和DNA共同组成核小体结构。它们是染色质的主要蛋白质组分,作为DNA缠绕的线轴,在基因调控中发挥重要作用。 组蛋白修饰(histone modification)是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化等修饰的过程。组蛋白修饰在细胞中同DNA修饰以及组蛋白变体等表观遗传变化常被用作 动态调节染色质的结构和功能。这是因为组蛋... 阅 读 全 部 >
2022 08-10 国自然热点:组蛋白修饰的10种研究思路(上篇) 组蛋白(histone)是真核生物体细胞染色质中的一种碱性蛋白质,和DNA共同组成核小体结构。它们是染色质的主要蛋白质组分,作为DNA缠绕的线轴,在基因调控中发挥重要作用。 组蛋白修饰(histone modification)是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化等修饰的过程。组蛋白修饰在细胞中同DNA修饰以及组蛋白变体等表观遗传变化常被用作 动态调节染色质的结构和功能。这是因为组蛋... 阅 读 全 部 >
2022 08-06 转座的“移花接木”之功-Tn5、ATAC-Seq、LIANTI、单细胞 高通量测序(NGS)技术的发展以及实验通量的不断增加,要求NGS上游样本处理步骤尽可能简便,以提高NGS整个流程的工作效率。转座系统具有快速“剪切、粘贴”、“复制、粘贴”的功能,已被创新应用于NGS领域,如ATAC-Seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing,利用高通量测序检测转座酶易接... 阅 读 全 部 >
2022 07-10 靶向RNA-seq全面解决方案和加速分析,只看这篇就够了! 背景RNA-seq,即通过高通量测序技术进行的转录组测序分析技术。最初作为研究mRNA,small RNA,non-coding RNA 等表达水平、表达差异基因的应用,在过去的十几年内迅速发展。而今, RNA-seq 在转录本变异、基因融合、可变剪切检测等场景均有大规模的应用。靶向 RNA-seq 则是对特定的转录本进行重点分析,与标准RNA-seq 类似,靶向富集方法可用于评...阅读全文&g... 阅 读 全 部 >
2022 07-09 快速识别异常值,你可能需要箱线图分析 当你在做数据总结分析,或者科研调查分析,甚至季度年度总结汇报,需要查看数据的分布情况以及是否有异常情况来形成结论辅助进一步分析时,那么哪种图表能够清晰直观地展现出这一信息呢?答案只有一个,那就是...箱线图!什么是箱线图箱线图,又名为盒须图,盒式图,通常用于展示一组数据的分布情况,因为主题形状像一个箱子,所以得名箱线图。它主要用于反映原始数据分布的特征,还可以进行多组数据...阅读全文>&g... 阅 读 全 部 >