2022 07-10 【转录组学】LncRNA鉴定思路与软件比较分析 1.非编码RNA简介非编码RNA是一类被认为不具备编码能力RNA,目前已知的已经有十多种,主要包括了:小RNA(sRNA) <40nt、小干扰RNA、miRNA(18-24nt)、长非编码lncRNA(>200nt)、核糖体RNA、核小RNA、核仁小RNA等等。随着人们认知的逐渐深入,发现这些非编码RNA在转录调控上发挥着重要的作用,并且其他部分同样具有编码...阅读全文>>... 阅 读 全 部 >
2022 07-09 16S从实验到数据分析最全流程 本文主要介绍了16S的实验、建库、数据分析等过程,也是我自己近期的一个小总结,初学之时从很多前辈的无私分享中受益良多,在此也和大家分享一些我的见解,当然我也只是一个初学者,还有很多不完备之处,希望能与各位一起交流分享。导航本文一共分为三个部分:实验部分建库测序16S测序数据分析一. 实验部分:DNA提取与质检1...阅读全文>>... 阅 读 全 部 >
2022 07-09 快速识别异常值,你可能需要箱线图分析 当你在做数据总结分析,或者科研调查分析,甚至季度年度总结汇报,需要查看数据的分布情况以及是否有异常情况来形成结论辅助进一步分析时,那么哪种图表能够清晰直观地展现出这一信息呢?答案只有一个,那就是...箱线图!什么是箱线图箱线图,又名为盒须图,盒式图,通常用于展示一组数据的分布情况,因为主题形状像一个箱子,所以得名箱线图。它主要用于反映原始数据分布的特征,还可以进行多组数据...阅读全文>&g... 阅 读 全 部 >
2022 07-08 dplyr包-行选择的方法 《R包学习》专栏·第3篇 文| R学习者2352字 | 6分钟阅读这是dplyr包系列第三篇文章。前两篇文章如下:前两篇文章是从 数据列的角度做选择和变换处理。这篇文章是从 数据行的角度,描写行选择的一系列操作与方法。数据的行,可以看作为 观察、样例、对象等。 数据的行选择,主要包括如下内容:1 基于比较运算的行选择2 基于字符匹配的行选择3 基于正则模式的行选择4 基于多条件的行选择5 跨越多列... 阅 读 全 部 >
2022 07-08 实习僧招聘网爬虫数据可视化 我本来对实习僧网站是没什么好感的,因为之前自己在实习僧上投的实习简历几乎全部都石沉大海了(一个文科生偏要去投数据分析岗不碰壁才怪~_~)!然鹅看到最近知乎爬虫圈儿里的两大趋势:爬美图;爬招聘网站。后来大致观察了下,几乎各类大型招聘文章都被别人爬过了,自己再去写免不了模仿之嫌,而且大神们都是用Python去爬的(Python我刚学会装包和导数据),自己也学不来。现在只能选一个还没怎么被盯上的招聘网站... 阅 读 全 部 >
2022 07-06 数据开发常用的几种数据预处理和数据整理方法 翻译|谢旭审校|张卫滨本文比较了用于数据准备的几种方法,它们分别是提取-变换-加载批处理(ETL)、流式获取和数据整理。本文还讨论了数据准备如何与可视化分析相关联,以及不同用户角色(如数据科学家或业务分析人员)应如何共同构建分析模型的最佳实践。要点在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。市场上有...阅读全文>>... 阅 读 全 部 >
2022 07-05 hisat2比对率批量统计的方法 grep 'Overall alignment rate: ' *.log |sed 's/Overall alignment rate: //'|sed 's/.log://'可以重定向阅读全文>>... 阅 读 全 部 >
2022 07-03 实用帖-手把手教你如何上传GEO数据库 还在为不知如何上传GEO数据库而发愁吗?还在为不愿意看繁琐的英文帮助而不知所措吗?一篇帖子教你如何上传GEO数据库,建议收藏,再也不用愁“书到用时方恨少”了。1、创建账号如果要上传GEO数据库,首先要创建NCBI帐号, 网址:https://www.ncbi.nlm.nih.gov/geo/submitter/登录成功后,回到GEO的主页,点击 Submissi...阅读全文>>... 阅 读 全 部 >
2022 07-03 如何0编程操作FASTA和FASTQ 现在搞科研,动不动就要接触高通量测序,想要来篇高分文章,没有高通量感觉都不太好意思,所以如果你还不知道什么是FASTQ和FASTA,那就太OUT了,其实他们在我们用的最多的PUBmed里随处可见:FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示。FASTQ格式中,每个序列通常有四行:第一行,序列标识以及相关的描述信息... 阅 读 全 部 >
2022 06-29 手把手教你画GO 功能分类图 | 分析技能 GO介绍GO是Gene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行标准化描述,即对基因产物进行注释,通过GO富集分析可以了解差异基因富集在哪些生物学功能、途径或者细胞定位,是高通量测序数据解读中比较常用的一种数据分析方法。下面跟着小编一起来来学习如何用excel画GO 功能分类图吧~一.图片结构说明观察上图,发现横坐标有分子类和父类,其次是纵坐标为..... 阅 读 全 部 >