2021 09-29 R知识速查表,值得收藏 编者按:R知识速查表囊括R基本知识,R高级知识,R数据导入,R数据可视化,R数据处理,字符串处理,正则表达式,日期时间处理,数据转换和机器学习。对于R新手,建议按着这个顺序学习和实践。【温馨提示:点击图片,可查看大图】一:基本 R 知识二:高级R知识三:数据可视化知识四:数据导入知识五:数据处理知识六:数据转换知识七:字符串处理知识八:正则表达式知识九:日期时间处理十:机器学习知识参考资料:...... 阅 读 全 部 >
2021 09-21 FastQ & FastA傻傻分不清? 如果你对生物信息不那么了解,或许会搞混FASTQ和FASTA,它们都是序列保存的一种格式,是用于NGS分析的基础数据。其实二者很好区分,并且可以通过一定的处理进行格式转换。FASTQFASTQ:是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。你拿到的测序数据均是fastq格式的。其序列以及质量信息都是使用一个ASCII字符标示,最初是由Sanger开发,目的是将F...阅读... 阅 读 全 部 >
2021 09-17 学习R语言,一篇文章让你从懵圈到入门 在实际工作中,每个数据科学项目各不相同,但基本都遵循一定的通用流程。具体如下:数据科学工作流程数据导入数据整理反复理解数据数据可视化数据转换统计建模作出推断(比如预测)沟通交流自动化分析程序开发下面列出每个步骤最有用的一些R包:数据导入以下R包主要用于数据导入和保存数据feather:一种快速,轻量级的文件格式。在R和python上都可使用readr:实现表格数据的快...阅读全文>>... 阅 读 全 部 >
2021 09-12 R基础|R的6种对象 前文我们讲到R处理数据面对的6种对象:向量,矩阵,数组,因子,列表,数据框。A. 那我们就得好好给大家介绍一下这位能者的6个对象都长什么样子了。· 1.向量 ·向量大体上分为3种,数值向量,字符向量,逻辑向量。(单个向量内元素类型必须一致)数值向量:> c(1,2,3,4,5,6,7)[1] 1 2 3 4 5 6 7字符向量(字符向量使用单...阅读全文>>... 阅 读 全 部 >
2021 09-08 收藏|零基础学R之数据结构,标量、向量、矩阵、数组、数据框和列表 预计阅读时间4分钟R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。它们在存储数据的类型、创建方式、结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同。下图是一张R语言数据结构图。文章目录快速检索,先看看哪部分感兴趣,查漏补缺~向量向量类型向量的创建向量中元素的访...阅读全文>>... 阅 读 全 部 >
2021 08-26 转录组测序——RPKM、FPKM、TPM 在转录组测序(RNA-Seq)中,对基因或转录本的read counts数目进行标准化(normalization)是一个极其重要的步骤,因为落在一个基因区域内的read counts数目取决于基因长度和测序深度。基因长度的影响:在同一个样本中,基因越长,随机打断得到的片段就越多,该基因被测到的概率就越大,比对到该基因的reads就越多。测序深度的影响:不同样本中,样本的测序深度越高...阅读全文... 阅 读 全 部 >
2021 08-25 抗性基因数据库CARD介绍 随着抗生素药物的发现及使用,越来越多的耐药菌株由此产生。而耐药菌株的发展则会增加疾病治疗的难度和成本,因此耐药微生物的研究则显得尤为重要。目前,通过对耐药基因的鉴定挖掘能够一定程度上帮助我们揭开耐药机制,为疾病的治疗、药物研发提供参考。ARDB是最先整合了各种微生物中抗药基因的数据库,但它从2009年开始就不再更新。而CARD(the Comprehensive Antibiotic Rese..... 阅 读 全 部 >
2021 08-25 研究微生物的你,这些数据库怎能不知道? 微生物的基因组序列被研究的越来越多,当我们得到菌株的基因组序列后,我们该怎样进行分析研究?通常我们会通过NCBI、KEGG等公共数据库来进行基因组的注释分析,但有时你会发现分析结果没有针对性,想要研究却无从下手。这时我们不妨换个专有数据库来试试,或许能得到不一样的结果,从而踏上“不一样”的科研之路,发更高分的文章。下面就让小编来介绍几个微生物专有数据库供大家参考。Isfinder (the ref... 阅 读 全 部 >
2021 08-25 寻找耐药菌的踪迹,CARD数据库在线使用教程来袭 随着抗生素药物的发现及使用,产生了越来越多的耐药菌株。耐药性会增加疾病治疗的难度和成本,因此耐药微生物的研究显得尤为重要。细菌的多种耐药机制由大量耐药基因所编码。耐药菌在基因水平上的改变主要包括固有耐药性、获得耐药性以及多重耐药性。固有耐药性来源于细菌本身染色体上的耐药基因。获得耐药性则是由于敏感的细菌发生基因突变或获得外源性耐药基因所产生的。多重耐药性则是指细菌同时对多种不同作用机制,或结...... 阅 读 全 部 >
2021 08-25 一篇带你玩转KEGG数据库注释 1.home网址:http://www.kegg.jp/kegg/2.关于kegg数据库的一些统计情况:http://www.kegg.jp/kegg/docs/statistics.html截止2018.4.12该数据库总共包含:525个代谢通路(Pathway maps),21,952条同源群(KEGG Orthology (KO) groups),涉及物种442真核生物、4654...阅读全... 阅 读 全 部 >