2022 08-29 降维算法只用tSNE?你out啦! 数据,已经渗透到当今各行各业和业务职能领域。但如何处理已获得的复杂数据并从中挖掘出有效的信息成为了大家关注的问题。其中数据可视化是极其重要的一个方面,因为 无论如何对数据进行分析处理,能够简明准确的展示最终结果,才是数据可视化的点睛之笔。在前几期的介绍中,王老师带领大家一起盘了许多FlowJo®插件,也针对数据分析软件的实际应用进行了分析, 那么本期,王老师将继续从生物学角度,带大家了解数... 阅 读 全 部 >
2022 08-29 如何让单细胞分群更简单 10X Genomics测得的单细胞数据是包含细胞及其表达量在内的高维数据,无论是PCA还是tSNE都是纯数学的数据降维方式,以此得到的细胞分群不具有生物学意义,故而我们通常需要赋予细胞分群以生物学含义即完成细胞亚群到细胞亚型的映射。在这一过程中,我们需要解决两个问题:(1)已知细胞亚型的鉴定,如外周血样品中鉴定红细胞、单核细胞等对应哪些细胞亚群;(2)未知细胞亚群或罕见细胞亚型的鉴定,如肝脏样品... 阅 读 全 部 >
2022 08-19 如何改造你的图片,让你的单细胞测序分析图向CNS看齐? 单细胞转录组学测序是目前比较火热的组学技术,单细胞测序在很多高分文章中露脸的次数非常频繁。然而数据拿到手,分析后的可视化也是发文章时的重点内容。看到CNS或者其他高质量文章中单细胞的可视化总是一种高大上的感觉,可是自己手里的数据可视化却是与别人有很大差距。那么,接下来就随着笔者初探单细胞作图的修饰,抛弃默认出图,修饰作图,提高档次,向好的文章看齐!也让自己的数据有一个更好的呈现!为了方便演示,示例... 阅 读 全 部 >
2022 08-19 PCA、LDA、MDS、LLE、TSNE等降维算法的Python实现 整理 | 夕颜【导读】网上关于各种降维算法的资料参差不齐,但大部分不提供源代码。近日,有人在 GitHub 上整理了一些经典降维算法的 Demo(Python)集合,同时给出了参考资料的链接。PCA资料链接:https://blog.csdn.net/u013719780/article/details/78352262https://blog.csdn.net/u013719780/articl... 阅 读 全 部 >
2022 08-19 R语言从入门到精通:Day14(PCA & tSNE) 实际工作中要处理的变量之间的关系往往是错综复杂的。处理这些多变量数据的最大挑战之一就是信息过度复杂,若数据集有100个变量,如何了解其中所有的交互关系呢?即使只有20个变量,当试图理解各个变量与其他变量的关系时,也需要考虑190对相互关系。主成分分析等方法是用来探索和简化多变量复杂关系的常用方法。在这里我们重点介绍两种简化多变量复杂关系,即降维的方法:主成分分析和t-SNE(t-Distri...... 阅 读 全 部 >
2022 08-19 还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码) 大数据文摘作品编译:寒小阳、蒋宝尚、Sheila、赖小娟、钱天培假设你有一个包含数百个特征(变量)的数据集,却对数据所属的领域几乎没有什么了解。 你需要去识别数据中的隐藏模式,探索和分析数据集。不仅如此,你还必须找出数据中是否存在模式--用以判定数据是有用信号还是噪音?这是否让你感到不知所措?当我第一次遇到这种情况,我简直全身发麻。想知道如何挖掘一个多维数据集? 这是许多数据科学家...阅读全文&... 阅 读 全 部 >
2022 08-18 单细胞测序中的聚类和降维,你真的分清楚了吗…… #单细胞测序的优势#近年来,快速发展的高通量测序,已经广泛应用于生命科学的各个领域。传统的混合细胞测序(bulk cells sequencing)检测的是数以万计的细胞群体平均后的表达水平,无法反应每个细胞的真实情况,这使得局部/微小组织的功能研究有了极高的门槛。同时,细胞异质性也成了研究组织中特殊种类的细胞功能作用时无法跨越的鸿沟。单细胞测序技术通过对单个细胞的RNA进行测序,精准得到单个细胞... 阅 读 全 部 >
2022 08-18 小学生都看得懂之 白话数据降维 据降维是数据分析中最常用到的一种技术了,这篇小文将试图用大白话讲一讲数据降维到底是什么,有什么用,常用的方法分别是什么?希望写的让小学生也能听懂,下面先为各位奉上这篇小文的思维导图。这篇文章贯穿始终的一个故事场景是如何在一个小镇上将横纵的街道编号,例如科技三路和凤城五路的接口这样一个用俩个数字标注的位置信息,转化更一个只用一个数字标识的位置描述。在上述的例子中,原来的位置信息有俩个维度,...阅读... 阅 读 全 部 >