2022 07-31 数据科学01- 数据科学家的工具箱 | PASS专题 数据科学家通过许多工具软件利用庞大或者混杂数据去解决回答许多复杂的难题。数据科学问题种类包括:描述性分析(deive analyses)探索性分析(exploratory analyses)推断分析(inferential analyses)预测分析(predictive analyses)因果分析(casual analyses)...阅读全文>>... 阅 读 全 部 >
2022 07-30 UCSC,基因组学人的专属浏览器 老规矩我们先上个链接https://genome.ucsc.edu/UCSC Genome Browser是由University of California Santa Cruz于2000年7月创立的旨在通过它迅速而且可靠地浏览任何一部分基因组,并同时获得与该部分相关的基因注释信息,包含但不限于已知基因,预测基因,表达序列标签,信使RNA,CpG岛,小鼠同源性等等此类基因组学...阅读全文>... 阅 读 全 部 >
2022 07-24 什么是siRNA转染?siRNA转染技术原理 RNA 代表核糖核酸和 siRNA——小干扰 RNA(也称为沉默 RNA)。siRNA 是分子中的一种短 (21-23 bp) 双链 RNA 核苷酸,在细胞中发挥各种生物系统的功能。siRNA转染是“转移”,将siRNA细胞内转移到细胞中,这是一个涉及基因沉默的过程。为了成功优化 siRNA 转染,需要合适的转染试剂和转染方法来进行体外和体内RNAi 实验。这些过程因细胞类型...阅读全文>... 阅 读 全 部 >
2022 07-10 数据库|Pfam在线注释以及本地化全攻略 Pfam: the protein families database11.501Nucleic Acids Res . 2014 Jan;42(Database issue):D222-30. doi: 10.1093/nar/gkt1223. Epub 2013 Nov 27.Abstract Pfam, available via servers in the UK (http:/... 阅... 阅 读 全 部 >
2022 07-08 dplyr包-行选择的方法 《R包学习》专栏·第3篇 文| R学习者2352字 | 6分钟阅读这是dplyr包系列第三篇文章。前两篇文章如下:前两篇文章是从 数据列的角度做选择和变换处理。这篇文章是从 数据行的角度,描写行选择的一系列操作与方法。数据的行,可以看作为 观察、样例、对象等。 数据的行选择,主要包括如下内容:1 基于比较运算的行选择2 基于字符匹配的行选择3 基于正则模式的行选择4 基于多条件的行选择5 跨越多列... 阅 读 全 部 >
2022 07-03 如何0编程操作FASTA和FASTQ 现在搞科研,动不动就要接触高通量测序,想要来篇高分文章,没有高通量感觉都不太好意思,所以如果你还不知道什么是FASTQ和FASTA,那就太OUT了,其实他们在我们用的最多的PUBmed里随处可见:FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示。FASTQ格式中,每个序列通常有四行:第一行,序列标识以及相关的描述信息... 阅 读 全 部 >
2022 07-01 ceRNA介绍及分析研究策略 前言现在生物学研究中对RNA的研究与日俱增,siRNA,piRNA,miRNA, LncRNA一个个明星分子层出不穷。更有一些新的名词不断产生,如ceRNA。其实ceRNA的提出也有一段时间了,而且它并不是一种新的RNA分子,而是一种调控机制。在最近的研究中表明基因在转录调控中存在多种模式作用,microRNA作为其中一种重要的调控因子,是长短约22nt的短链RNA,能够通过抑制目...阅读全文&... 阅 读 全 部 >
2022 06-30 手把手教你复现一幅CNS级别美图!附代码,建议收藏! 一文学会利用ComplexHeatmap包绘制超美热图 大家好,我是风。随着生物信息学的普及,各类在线网站已经能够做出很多精美的图片。一种东西大众化,那想做得脱颖而出,就要考虑如何把大众化的东西做得个性化。尽管绘图网站能够做出精美的图片,然而却无法让你与众不同。好马要靠鞍,好数据也要有个好包装,今天开始,我们来一起学习一个绘制热图的R包——ComplexHeatmap包,用它来为你的文章添加一张让... 阅 读 全 部 >
2022 06-29 KEGG富集分析从未如此简单 考虑到很多做实验的小伙伴对很多生物信息学概念不是很了解,受实验小白的委托,我给大家写了一个非常简单的工具:KEGG富集分析KEGG是干嘛的捏?我这么跟你说吧:人类的七千多个基因组都是有已知功能的,KEGG把这七千多个基因分成了300个类,就是我们通常说的kegg通路;比如,我现在做了个实验,发现某细胞系里面的两万个基因里面有300个基因变化了,那这300个基因会涉及到KEGG数据库的哪几个通路?这... 阅 读 全 部 >
2022 06-28 2022你必须要知道这些机器学习和数据科学的8大IDE,快来看看 如果您是数据科学家或机器学习工程师,那么您应该熟悉最高效的机器学习 IDE。IDE(集成开发环境)是 允许软件开发人员更轻松地编写、测试、调试和使用代码的工具。它的其他用途还有代码验证、文本编辑器、语法突出显示、补全、上下文建议、调试工具、方法和类规范、资源管理以及轻松访问帮助。IDE 通常具有广泛的功能集合。因此,它们也有利于数据科学编程。它们使程序员的生活变得更加轻松。...阅读全文>&... 阅 读 全 部 >