2022 08-19 R语言从入门到精通:Day14(PCA & tSNE) 实际工作中要处理的变量之间的关系往往是错综复杂的。处理这些多变量数据的最大挑战之一就是信息过度复杂,若数据集有100个变量,如何了解其中所有的交互关系呢?即使只有20个变量,当试图理解各个变量与其他变量的关系时,也需要考虑190对相互关系。主成分分析等方法是用来探索和简化多变量复杂关系的常用方法。在这里我们重点介绍两种简化多变量复杂关系,即降维的方法:主成分分析和t-SNE(t-Distri...... 阅 读 全 部 >
2022 08-19 还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码) 大数据文摘作品编译:寒小阳、蒋宝尚、Sheila、赖小娟、钱天培假设你有一个包含数百个特征(变量)的数据集,却对数据所属的领域几乎没有什么了解。 你需要去识别数据中的隐藏模式,探索和分析数据集。不仅如此,你还必须找出数据中是否存在模式--用以判定数据是有用信号还是噪音?这是否让你感到不知所措?当我第一次遇到这种情况,我简直全身发麻。想知道如何挖掘一个多维数据集? 这是许多数据科学家...阅读全文&... 阅 读 全 部 >
2022 08-19 毕业救星!这个R包在高分文章常见,实用!好学! Seurat对象剖析以及Seurat Command List前景回顾首次揭秘!不做实验也能发10+SCI,CNS级别空间转录组套路全解析(附超详细代码!)过关神助!99%审稿人必问,多数据集联合分析,你注意到这点了吗?太猛了!万字长文单细胞分析全流程讲解,看完就能发文章!建议收藏!(附代码)秀儿!10+生信分析最大的难点在这里!30多种方法怎么选?今天帮你解决! ...阅读全文>>... 阅 读 全 部 >
2022 08-18 单细胞测序中的聚类和降维,你真的分清楚了吗…… #单细胞测序的优势#近年来,快速发展的高通量测序,已经广泛应用于生命科学的各个领域。传统的混合细胞测序(bulk cells sequencing)检测的是数以万计的细胞群体平均后的表达水平,无法反应每个细胞的真实情况,这使得局部/微小组织的功能研究有了极高的门槛。同时,细胞异质性也成了研究组织中特殊种类的细胞功能作用时无法跨越的鸿沟。单细胞测序技术通过对单个细胞的RNA进行测序,精准得到单个细胞... 阅 读 全 部 >
2022 08-18 小学生都看得懂之 白话数据降维 据降维是数据分析中最常用到的一种技术了,这篇小文将试图用大白话讲一讲数据降维到底是什么,有什么用,常用的方法分别是什么?希望写的让小学生也能听懂,下面先为各位奉上这篇小文的思维导图。这篇文章贯穿始终的一个故事场景是如何在一个小镇上将横纵的街道编号,例如科技三路和凤城五路的接口这样一个用俩个数字标注的位置信息,转化更一个只用一个数字标识的位置描述。在上述的例子中,原来的位置信息有俩个维度,...阅读... 阅 读 全 部 >
2022 08-18 STRING数据库的蛋白质相互作用(PPI)网络分析 在转录调控相关的文献中,我们经常能够看到这样的蛋白质相互作用网络(protein protein interaction network,PPI network)。具体而言,这些相关的文献中首先通过RNA-seq、表达谱芯片或者蛋白质组分析等,找到了在不同分组样本间一系列的差异表达基因或蛋白。随后,通过STRING数据库(https://string-db.org/)检索了编码蛋白间...阅读全文... 阅 读 全 部 >
2022 08-15 LncRNA综述 一、研究背景lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,有文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的这些调控作用也开始引起人们广泛的关注。西班牙IMIM(Hospital del Mar Medical Research Institute)和加泰... 阅 读 全 部 >
2022 08-13 国自然热点:组蛋白修饰的10种研究思路(下篇) 组蛋白(histone)是真核生物体细胞染色质中的一种碱性蛋白质,和DNA共同组成核小体结构。它们是染色质的主要蛋白质组分,作为DNA缠绕的线轴,在基因调控中发挥重要作用。 组蛋白修饰(histone modification)是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化等修饰的过程。组蛋白修饰在细胞中同DNA修饰以及组蛋白变体等表观遗传变化常被用作 动态调节染色质的结构和功能。这是因为组蛋... 阅 读 全 部 >
2022 08-10 国自然热点:组蛋白修饰的10种研究思路(上篇) 组蛋白(histone)是真核生物体细胞染色质中的一种碱性蛋白质,和DNA共同组成核小体结构。它们是染色质的主要蛋白质组分,作为DNA缠绕的线轴,在基因调控中发挥重要作用。 组蛋白修饰(histone modification)是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化等修饰的过程。组蛋白修饰在细胞中同DNA修饰以及组蛋白变体等表观遗传变化常被用作 动态调节染色质的结构和功能。这是因为组蛋... 阅 读 全 部 >
2022 08-06 转座的“移花接木”之功-Tn5、ATAC-Seq、LIANTI、单细胞 高通量测序(NGS)技术的发展以及实验通量的不断增加,要求NGS上游样本处理步骤尽可能简便,以提高NGS整个流程的工作效率。转座系统具有快速“剪切、粘贴”、“复制、粘贴”的功能,已被创新应用于NGS领域,如ATAC-Seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing,利用高通量测序检测转座酶易接... 阅 读 全 部 >