2022 02-02 又一伟大计划:ENCODE(DNA元件百科全书) 二十一世纪之初,在多国科学家的共同努力下,人类基因组草图被成功绘制。但让人们大吃一惊的是在人类基因组中能够编码蛋白质的基因只占整个人类基因组的不到2%,其余超过98%的人类基因组是做什么的还不清楚,有科学家把这些DNA叫做“垃圾DNA”,或基因组里的“暗物质”。为了解析这些所谓“垃圾DNA”的结构和功能,在2003年由美国人类基因组研究所(NHGRI)和欧洲生物信息研究所(EMBL)牵头,开展了E... 阅 读 全 部 >
2022 01-16 聊一聊 QTL 定位的原理 通过前两周的《本地化适应是怎么发生的?》和《突变是否影响个体的适应性?》了解了群体的核酸多样性后,我们接下来就开始要着手进行功能基因的定位了。工欲善其事,必先利其器。在我们可以自由选用各类实验设计前,我们需要了解各种方法的基本原理。让我们先从连锁分析开始。1. 连锁分析的基本原理既然群体中产生了多样性,我们就期望将与性状相关的基因定位出来。在之前的文章中,我们提到功能基因定位的方法主要包...阅读... 阅 读 全 部 >
2022 01-02 技能篇 | NCBI的5种常见使用方法(二) 一、查找基因序列、mRNA序列进入NCBI 主页,在 search 后面选择 Gene,输入需要查找的基因的名字,点击search,查看结果。以基因P53为例,搜索结果如图:点击红框部分,进入并下拉,可以看到大量的信息,如下图:二、用Probe查找已经公布的引物序列进入NCBI主页,在下拉菜单选择Probe之后填写需要查找的基因名称。...阅读全文>>... 阅 读 全 部 >
2021 12-26 R语言数据处理——数据合并与追加 数据结构的塑造是数据可视化前重要的一环,虽说本公众号重心在于数据可视化,可是涉及到一些至关重要的数据整合技巧,还是有必要跟大家分享一下的。在可视化前的数据处理技巧中,导入导出、长宽转换已经跟大家详细的介绍过了。今天跟大大家分享数据集的合并与追加,并且这里根据所依赖函数的处理效率,给出诺干套解决方案。数据合并操作涉及以下几个问题:横向合并;1. 是否需要匹配字段1.1 匹配字段合并 1.1.1 主字... 阅 读 全 部 >
2021 11-20 全基因组重测序比较两个样品之间的差异,为什么要参考基因组 全基因组重测序老师经常需要比较两个样品之间的差异,我们遇到部分老师希望能分别得到样品的基因组,然后再进行比较,或者指定一个样品做为参照后与之比较。这种方法在技术上部分可行,但几乎没有意义。首先,现有的二代测序技术由于读长限制,无法拼出完整的参考基因组;其次,如果是多倍体物种或者混合物种,在基因组中存在大量的杂合位点,在拼接基因组时,对于杂合位点无论用哪个碱基来做参考,都会造成杂合位点信息丢失,进而... 阅 读 全 部 >
2021 11-12 NCBI官方基因组坐标转换工具 首先强调这是一篇实用贴,做基因组学研究的朋友们也许经常会碰到准确获取基因或者某一功能位点在基因组上的位置的问题。随着人类基因组计划的完成,这项工作理论上很好解决,但问题是随着基因组数据的不断完善,序列信息在不断更新,所以我们经常会碰到不同的基因组assembly版本,如hg18, hg19, GRCh37, GRCh38等等。因此,使用一个快捷权威的基因组坐标转换工具尤为重要。小编通...阅读全文... 阅 读 全 部 >
2021 11-02 基因研究不知道转录本,做什么引物设计?! 我们平常通过数据库查找某个基因的相关信息时,会发现该基因有多个转录本。为什么一个基因可以有多个转录本呢?转录本能干什么?转录本其实就是基因通过转录形成的一种或多种可供编码蛋白质的成熟的mRNA。一个基因有可能有多个转录本,原因是由于不同的剪接方式造成的。我们都知道,基因转录之后,首先是形成前体mRNA,通过剪切内含子连接外显子,5’端加帽及3’端加尾之后形成成熟的mRNA。...阅读全文>&... 阅 读 全 部 >
2021 10-09 我做数据分析工作常用的8个R包 文| R扫地僧1910字 | 6分钟阅读大家好,我是一名数据分析师,目前在一家互联网公司,做私域业务相关的数据分析工作。我经常会用R语言解决数据分析工作系列问题。在此,我分享下做数据分析工作常用的8个R包,也欢迎朋友们补充和分享自己常用的R包。1 dplyr包我用dplyr包做数据的整理工作,包括数据的选择(业务所需的行与列),变量的新增,数据的集成(常用的内连接和左连接),数据的聚合运算(描述性... 阅 读 全 部 >
2021 10-05 R Markdown:可能是你数据分析报告最好的解决方案 为什么要用Rmd?“如果你是第一次听到R Markdown这个名词的话,可能你会问R Markdown是什么?我们能用它来做什么?怎么使用R Markdown?且听小编跟你道来。”当初人才计划进行到第二阶段的时候,水妈要求我们所有的 R 代码都需要通过R Markdown生成html来提交。一开始并不了解其中奥义,在此之前印象中那只是一个可以用来生成数据分析文件格式的工具。经过一段时间学...阅读... 阅 读 全 部 >
2021 10-03 RStudio|用R Markdown生成你的R语言数据分析报告 R Markadown 作为一款通过R语言创建动态文档的写作排版工具,为数据科学提供了现成的写作框架。通过 R Markdown 不仅可以运行和保存R代码,还可以生成高质量的数据分析报告并以HTML、PDF或者word的形式分享。1,get started很早就对R语言可以制作高质量的报告有所耳闻,但也没有很强的意愿去研究一番。究其缘由在于写公众号时无法不会优雅的插入代码块,便有意...阅读全文&... 阅 读 全 部 >