2022 06-27 R语言自然语言处理:关键词提取与文本摘要(TextRank) 作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:[email protected]关于提取关键词的方法,除了TF-IDF算法,比较有名的还有TextRank算法。它是基于PageRank衍生出来的自然语言处理算法,是一种基于图论的排序算法,以文本的相似度作为边的权重,迭代计算每个文本的TextRa... 阅 读 全 部 >
2022 06-27 巨简单的生信分析+巨简单的实验发7+的非肿瘤研究生信文章 今天就跟大家分享一篇 巨简单的生信分析 + 巨简单的实验发 7+ 的非肿瘤研究生信文章,看完直呼:我也行! 文章题目:Identification and Clinical Validation of Key Extracellular Proteins as the Potential Biomarkers in Relapsing-Remitting Multiple Sclerosi...阅... 阅 读 全 部 >
2022 06-27 老司机带你解锁蛋白质互作网络分析 蛋白质互作网络是由蛋白通过彼此之间的相互作用构成,来参与生物信号传递、基因表达调节、能量和物质代谢及细胞周期调控等生命过程的各个环节。系统分析大量蛋白在生物系统中的相互作用关系,对了解生物系统中蛋白质的工作原理,了解疾病等特殊生理状态下生物信号和能量物质代谢的反应机制,以及了解蛋白之间的功能联系都有重要意义。那么如何分析蛋白质互作网络?如何发现复杂网络的关键蛋白和子网络?如何使用马尔科夫(MCL)... 阅 读 全 部 >
2022 06-26 3分钟搞定GO/KEGG富集分析 在进行差异基因表达分析时,得到显著差异基因后,接下来就需要分析这些基因参与了哪些功能,常见的就是GO功能注释和KEGG通路富集分析,今天为大家介绍在线分析工具的使用——DAVID与KOBAS 3.0。DAVID是一个生物信息数据库,其整合了生物学数据和分析工具,为大规模的基因或蛋白列表提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。目前DAVID数据库主要用于差异基因的功能和通路...... 阅 读 全 部 >
2022 06-26 2022年m6A做分型依然是热点! 导语GUIDE ╲基于m6A调节因子的signature可以区分头颈部鳞状细胞癌患者的预后。背景介绍今天小编为大家带来一篇经典的m6A调节因子相关基因作为signature进行分型预后的文章。这篇文章2022年2月刚刚发表在 Front Immunol (实时影响因子8分+),说明今年m6A依然是热点。 数据介绍本文使用TCGA-HNSCC数据(https://xenabrowser.n...阅读... 阅 读 全 部 >
2022 06-25 Cytoscape:强大的pathway分析可视化工具 生信分析中我们经常会做KEGG和GO富集分析,一般拿到结果后就想到用柱状图展示pathway的富集情况。比如下面这样:如果学会使用Cytoscape中的ClueGO+CluePedia插件,可以帮我们更形象地展示pathway之间的关系,以及gene在pathway中的富集情况,论文插图瞬间提示一个档次,比如像这样:下面我们就来看一下如何使用Cytoscape中的Clue...阅读全文>&g... 阅 读 全 部 >
2022 06-25 高逼格生信绘图神器 —ClueGO GO和KEGG分析是最常用的生信分析方法,在SCI论文中也经常见到,那么你能想到的GO和KEGG分析结果的展示方法有哪些呢?条形图:饼状图:表格:相比于上面这些,这样的网络图展示起来是不是立马提升了几个档次:首先讲一下如何获取这一利器,ClueGO和CluePedia是Cytoscape的APP,点开Cytoscape的Apps菜单,找到这两个APP把它们下载安装了。然后你就能在Apps...阅读... 阅 读 全 部 >
2022 06-24 学习笔记 | R 语言绘制热图的 10 种方法 说在前面此前我们已经推送了不少深入解读的文章,今天希望做一点新的尝试——介绍 R 语言绘图。这一期分享 R 语言绘制热图的案例,希望大家通过案例感受 R 语言的强大,同时消除对热图等看似高大上的图形的恐惧感,在文献阅读时更加从容,今后也尝试去绘制这样炫酷的图,如果能够放到文章里面就完美了。什么是 R 语言?R 语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。我之所以学 ..... 阅 读 全 部 >
2022 06-24 So easy!搞定数据质控,这三张图学会就够了! 学会这3张图,搞定数据质控So easy嗨,小伙伴们大家好~!上期我们讲到数据质控的重要性,即在表达差异分析之前需查验数据质量是否合格,如下面3张图所示,热图、PCA图和聚类树的结果均表示实验组和对照组分开的比较好,数据质量可。那么这期我们就接着这个话题,来看看如何绘制这3张图,搞定数据质控问题So easy!▌加载示例数据加载基因表达谱和样本信息文件,gene exp res是已完成基因...阅... 阅 读 全 部 >
2022 06-24 pheatmap绘制“热图”,你需要的都在这 热图可以聚合大量的数据,并可以用一种渐进色来优雅地表现,可以很直观地展现数据的疏密程度或频率高低。 本文利用R语言 pheatmap 包从头开始绘制各种漂亮的热图。参数像积木,拼凑出你最喜欢的热图即可,如下图: 基因和样本都可以单独聚类,排序,聚类再...阅读全文>&g... 阅 读 全 部 >