2023 03-05 肿瘤变异数据分析和可视化工具maftools:安装和文件格式要求 Maftools系列文章:《maftools使用方法总结以及常见问题》《肿瘤变异数据分析和可视化工具maftools:安装和文件格式要求》《肿瘤变异数据分析和可视化工具maftools:突变数据下载和可视化》《肿瘤变异数据分析和可视化工具maftools:突变的数据分析》《肿瘤变异数据...阅读全文>>... 阅 读 全 部 >
2023 03-05 肿瘤变异数据分析和可视化工具maftools: CNV的可视化 Maftools系列文章:《maftools使用方法总结以及常见问题》《肿瘤变异数据分析和可视化工具maftools:安装和文件格式要求》《肿瘤变异数据分析和可视化工具maftools:突变数据下载和可视化》《肿瘤变异数据分析和可视化工具maftools:突变的数据分析》...阅读全文>>... 阅 读 全 部 >
2023 03-05 WGS,WES,RNA-Seq与ChIP-seq之间的异同 全外显子(Whole-exome sequencing)测序是啥?转录组(RNA-seq)测序是啥?ChIP-seq又是啥?它们之间有什么差别么?傻傻分不清,不用怕,多学习下就会了,下面让我们一起来从平均测序深度和区域覆盖度的角度来区分它们吧!1 基础概念平均测序深度:指定区域内得到的所有碱基数目与该区域的长度的比值,如果是全基因组,就是整个测序的碱基数目...阅读全文>>... 阅 读 全 部 >
2023 03-05 WES(3)snp-filter 其中freebayes,bcftools,gatk都是把所有的snp细节都call出来了,可以看到下面这些软件的结果有的高达一百多万个snp,而一般文献都说外显子组测序可鉴定约8万个变异!这样得到突变太多了,所以需要过滤。这里过滤的统一标准都是qual大于20,测序深度大于10。过滤之后的snp数量如下perl -alne ‘{next if $F[5]<20;/...阅读全文>>... 阅 读 全 部 >
2023 03-05 WES(2)snp-calling 准备文件:下载必备的软件和参考基因组数据1、软件ps:还有samtools,freebayes和varscan软件,我以前下载过,这次就没有再弄了,但是下面会用到2、参考基因组3、参考 突变数据第一步,下载数据第二步,bwa比对第三步,sam转为bam,并sort好第四步,标记P...阅读全文>>... 阅 读 全 部 >
2023 03-04 WES(1)测序质量控制 这一步主要看看这些外显子测序数据的测序质量如何:首先用fastqc处理,会出一些图表,肯定是没问题的啦,如果数据有问题,公司就不会给你,那样不砸了他们自己的招牌嘛。然后我们粗略统计下平均测序深度及目标区域覆盖度,这个是重点,不过一般没问题的,因为现在芯片捕获技术非常成熟了,而且实验水平大幅提升,没有以前那么多的问题了。这个外显子项目的测序文件里面,...阅读全文>>... 阅 读 全 部 >
2023 03-04 使用cnvkit来对大批量wes样本找cnv—科研必备基因组学知识 cnvkit被设计来处理同一个批次的多个肿瘤配对样本测序情况,首先对所有的normal数据进行bin处理拿到背景值,然后就这个背景值来处理所有的tumor测序数据计算拷贝数变异情况。该软件使用比较复杂,建议读一读官网教程。所有的命令都被包装到一个python脚本里面,使用该脚本调用一系列字命令,如下:官网教程Copy number calling pipelinebatchtarge...阅读全文... 阅 读 全 部 >
2023 03-04 CNVnator和CNVpytor的使用—科研必备知识 CNVnator可用于分析全基因组CNV。软件依赖于root框架以及samtools。最终的可视化也是依赖于root软件,另外还有衍生的拓展程序CNVpytor。从更新时间以及介绍页面看,CNVpytor貌似能更好的出图。安装CNVnator的安装git clone https://github.com/abyzovlab/CNVnator.git...阅读全文>>... 阅 读 全 部 >
2023 03-04 【生物信息学笔记】其他主要生物信息资源 这一节里,我们来看一下独立资源的几个例子。一个很重要的资源是蛋白三维结构数据库 Protein DataBank (PDB)。我们这门课里对于蛋白三维结构的计算和预测讲的很少,但这其实也是非常重要的资源和研究方向。Protein DataBank现在主要是由Rutgers和UC Sandiego共同来管理。它目前共有9万多,将近10万的三维结构,包括8万多的X-r...阅读全文>>... 阅 读 全 部 >
2023 03-03 GATK使用—科研必备基因组学知识 首先说说GATK可以做什么。它主要用于从sequencing 数据中进行variant calling,包括SNP、INDEL。比如现在风行的exome sequencing找variant,一般通过BWA+GATK的pipeline进行数据分析。要run GATK,首先得了解它的网站(http://www.broadinstitute.org/gatk/)。一.准备工作...阅读全文>&g... 阅 读 全 部 >