2022 03-26 全基因组关联分析项目设计——基因分型策略 本期文章将给大家介绍基因分型策略的相关知识: 1. 四种基因分型技术简要比较 对于GWAS 研究,关键就是需要对目标群体的每个个体开展全基因组水平的基因型检测。4种测序策略所能检测的区域有所区别,如下图示意图所示。图1 四种基因分型策略检测区域的示意图,图中绿色长方块代表对应的测序技术所能检测的区域(1 )全基因组重测序理论上可以检测基因组范围内所有位置的突变信息,常见检测的突变类似包括:SNP ... 阅 读 全 部 >
2022 03-25 全基因组关联分析(GWAS) — 群体结构 全基因组关联分析(GWAS)目前已经成为研究复杂性状和疾病遗传变异的有效手段,但是由于群体结构的存在,导致分析结果出现假阳性。经过数十年的发展,新的方法的不断出现,才使得群体结构对分析的影响进一步降低。Timeline of GWAS目前GWAS主要采取两种实验设计,一种是基于情缘关系的群体(Population-based cohorts)设计;另一种是基于无关个体的病例-对照(...阅读全文&... 阅 读 全 部 >
2022 03-23 宏基因组:扩增子测序常用数据库整理与介绍 微生物扩增子测序是研究微生物组成的重要方法,且成本较低,是许多课题组的首要选择。扩增子测序数据分析最主要的一个材料就是扩增子数据库,用来与测序数据进行比对,并进行物种注释,主要收录了微生物的16S,18S个ITS序列信息。扩增子数据库版本较多,本期就对主流的扩增子数据库进行一个详细的整理和介绍,以便大家选择使用。1. GreenGenes网址:http://greengenes.s...阅读全文&... 阅 读 全 部 >
2022 03-20 R如何直接读取Excel表格数据? 对于24K纯生信小白来说,数据准备绝对是一件令人头疼的问题。还记得我第一次用ClustalX做序列Alinment时一直不出结果,折腾了一下午偶然发现出错仅仅因为文件名是中文的。经过这次教训以后,自己也养成了个习惯,不管是文件名还是表格内容绝不用中文,哪怕是用拼音表示。在《你可能需要一个功能强大一点的文本编辑器……》一文,已介绍过用Notepad++查看Excel中不容易发现的格式错误。可还是有小... 阅 读 全 部 >
2022 03-14 表观组学中的motif分析到底在研究什么? # 一、无处不在的motif #在各类表观组学文章中,motif分析总是占据着关键版面,例如m6A文章中经典的RRACH类型RNA甲基化motif、ATAC文章中各类转录因子结合位点预测也少不了motif结果的展示,甚至可以利用motif分析预测蛋白功能。用途如此广泛的分析究竟该如何去理解与学习其基础概念,手上有数据该如何完成此类分析,分析结果又如何解读,今天我们就带大家来好好认识一下这位期刊文章... 阅 读 全 部 >
2022 03-07 使用OpenCV测量图像中物体的尺寸大小 首先,您需要知道类似于比例的概念称为每度量比的像素(pixels per metric ratio)。近似含义是每个单位指标中包含的像素数。例如,图表上的1厘米包含100张图像。实际上,相当于引用对象的作用,例如已知地图上的引用材质,我们可以使用此引用对象将其转换为地图上其他对象的大小。引用对象需要具有两个重要属性:属性#1:我们应该以可测量的单位(例如毫米...阅读全文>>... 阅 读 全 部 >
2022 02-20 Nature genetics:番茄泛基因组揭示番茄新基因及调控果实风味的稀有等位基因 什么是泛基因组?泛基因组(pan-genome)作为一个概念出现的时间并不长,相应的研究文献也并不多。但它作为基因组学研究积累到一定阶段而出现,在更大尺度上进行的研究,甫一面世便受到了研究者广泛的关注。泛基因组(pan-genome)指一个群体中所有基因组的总和,其中前缀pan来源于希腊语“παν”(指全部)。泛基因组通过对一个物种中多个个体或是一个分类群体中多个物种的基因组信息进行分析...阅读... 阅 读 全 部 >
2022 02-11 10分钟带你了解泛基因组做些什么(干货) 近年来,越来越多的研究表明,单一或者少数参考基因组不能涵盖整个种群全部的遗传信息,所以,构建物种的泛基因组成了当前基因组学研究的热点和前沿。本篇文章,小编和大家一起来了解一下泛基因组的构建方式、泛基因组的热点研究内容。一、泛基因组的构建策略泛基因组构建主要分为以下三种方式[1]:(1)选取一个参考基因组,各个材料的测序reads分别比对,将未比对上的reads进行组装,通过“比对-组装”的迭代过程... 阅 读 全 部 >
2022 02-06 如何提取gff文件中的基因注释信息 gff3格式注释文件是最常见的基因注释,(https://archive.broadinstitute.org/annotation/argo/help/gff3.html)简单来说,gff3是以tab分隔的文本文件,共有9列,对应信息如下:1、seqname The name of the sequence. Typically a chromosome or a contig. Argo ..... 阅 读 全 部 >
2022 02-03 功能基因组学研究利器——Hi-C 前期的推文中我们介绍了一种基于末端标签序列研究染色质交互作用的方法(ChIA-PET),本期中,我们再介绍一种应用更加广泛的染色质三维结构信息捕获方法——Hi-C.一、Hi-C技术的发展一提到Hi-C,我们不得不先说下它的老祖宗,3C,即Chromosome Conformation Capture。2002年,Job Dekker团队在《Science》发文,首次报道了...阅读全文>&g... 阅 读 全 部 >