2022 08-20 新一代配色R包,还不赶快升级你的配色方案? 当我开始使用R时,像任何初学者一样,我想要一个真正能够工作的代码和一个最低限度可理解的图像,并且很长一段时间这是我的主要目标,但是一旦这一点完成后,我意识到我的可视化看起来很糟糕,特别是在比较和审查其他博客和网站之后,我开始搜索如何改进我的可视化。下面,创建一个简单且专业的图像的一些技巧,以吸引读者的注意力。01 创建可视化让我们开始一个简单的可视化,来自diamonds数据集的直方图。1.1 包... 阅 读 全 部 >
2022 08-19 PCA、LDA、MDS、LLE、TSNE等降维算法的Python实现 整理 | 夕颜【导读】网上关于各种降维算法的资料参差不齐,但大部分不提供源代码。近日,有人在 GitHub 上整理了一些经典降维算法的 Demo(Python)集合,同时给出了参考资料的链接。PCA资料链接:https://blog.csdn.net/u013719780/article/details/78352262https://blog.csdn.net/u013719780/articl... 阅 读 全 部 >
2022 08-19 R语言从入门到精通:Day14(PCA & tSNE) 实际工作中要处理的变量之间的关系往往是错综复杂的。处理这些多变量数据的最大挑战之一就是信息过度复杂,若数据集有100个变量,如何了解其中所有的交互关系呢?即使只有20个变量,当试图理解各个变量与其他变量的关系时,也需要考虑190对相互关系。主成分分析等方法是用来探索和简化多变量复杂关系的常用方法。在这里我们重点介绍两种简化多变量复杂关系,即降维的方法:主成分分析和t-SNE(t-Distri...... 阅 读 全 部 >
2022 08-19 还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码) 大数据文摘作品编译:寒小阳、蒋宝尚、Sheila、赖小娟、钱天培假设你有一个包含数百个特征(变量)的数据集,却对数据所属的领域几乎没有什么了解。 你需要去识别数据中的隐藏模式,探索和分析数据集。不仅如此,你还必须找出数据中是否存在模式--用以判定数据是有用信号还是噪音?这是否让你感到不知所措?当我第一次遇到这种情况,我简直全身发麻。想知道如何挖掘一个多维数据集? 这是许多数据科学家...阅读全文&... 阅 读 全 部 >
2022 08-19 毕业救星!这个R包在高分文章常见,实用!好学! Seurat对象剖析以及Seurat Command List前景回顾首次揭秘!不做实验也能发10+SCI,CNS级别空间转录组套路全解析(附超详细代码!)过关神助!99%审稿人必问,多数据集联合分析,你注意到这点了吗?太猛了!万字长文单细胞分析全流程讲解,看完就能发文章!建议收藏!(附代码)秀儿!10+生信分析最大的难点在这里!30多种方法怎么选?今天帮你解决! ...阅读全文>>... 阅 读 全 部 >
2022 08-18 单细胞测序中的聚类和降维,你真的分清楚了吗…… #单细胞测序的优势#近年来,快速发展的高通量测序,已经广泛应用于生命科学的各个领域。传统的混合细胞测序(bulk cells sequencing)检测的是数以万计的细胞群体平均后的表达水平,无法反应每个细胞的真实情况,这使得局部/微小组织的功能研究有了极高的门槛。同时,细胞异质性也成了研究组织中特殊种类的细胞功能作用时无法跨越的鸿沟。单细胞测序技术通过对单个细胞的RNA进行测序,精准得到单个细胞... 阅 读 全 部 >
2022 08-18 小学生都看得懂之 白话数据降维 据降维是数据分析中最常用到的一种技术了,这篇小文将试图用大白话讲一讲数据降维到底是什么,有什么用,常用的方法分别是什么?希望写的让小学生也能听懂,下面先为各位奉上这篇小文的思维导图。这篇文章贯穿始终的一个故事场景是如何在一个小镇上将横纵的街道编号,例如科技三路和凤城五路的接口这样一个用俩个数字标注的位置信息,转化更一个只用一个数字标识的位置描述。在上述的例子中,原来的位置信息有俩个维度,...阅读... 阅 读 全 部 >
2022 08-18 STRING数据库的蛋白质相互作用(PPI)网络分析 在转录调控相关的文献中,我们经常能够看到这样的蛋白质相互作用网络(protein protein interaction network,PPI network)。具体而言,这些相关的文献中首先通过RNA-seq、表达谱芯片或者蛋白质组分析等,找到了在不同分组样本间一系列的差异表达基因或蛋白。随后,通过STRING数据库(https://string-db.org/)检索了编码蛋白间...阅读全文... 阅 读 全 部 >
2022 08-15 LncRNA综述 一、研究背景lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,有文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的这些调控作用也开始引起人们广泛的关注。西班牙IMIM(Hospital del Mar Medical Research Institute)和加泰... 阅 读 全 部 >
2022 08-13 国自然热点:组蛋白修饰的10种研究思路(下篇) 组蛋白(histone)是真核生物体细胞染色质中的一种碱性蛋白质,和DNA共同组成核小体结构。它们是染色质的主要蛋白质组分,作为DNA缠绕的线轴,在基因调控中发挥重要作用。 组蛋白修饰(histone modification)是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化等修饰的过程。组蛋白修饰在细胞中同DNA修饰以及组蛋白变体等表观遗传变化常被用作 动态调节染色质的结构和功能。这是因为组蛋... 阅 读 全 部 >