ATAC-Seq分析教程系列
ATAC-Seq分析教程:ATAC-seq的背景介绍以及与ChIP-Seq的异同
ATAC-Seq分析教程:原始数据的质控、比对和过滤
ATAC-Seq分析教程:用MACS2软件call peaks
ATAC-Seq分析教程:对ATAC-Seq/ChIP-seq的质量评估(一)phantompeakqualtools
ATAC-Seq分析教程:对ATAC-Seq/ChIP-seq的质量评估(二)ChIPQC
ATAC-Seq分析教程:重复样本的处理-IDR
ATAC-Seq分析教程:用ChIPseeker对peaks进行注释和可视化
ATAC-Seq分析教程:用网页版工具做功能分析和motif分析
ATAC-Seq分析教程:差异peaks分析——DiffBind
ATAC-Seq分析教程:ATAC-Seq、ChIP-Seq、RNA-Seq整合分析
提取IDR结果文件的前3列
cut -f 1,2,3 Nanog-idr-merged.bed > Nanog-idr-merged-great.bed
使用bedtools getfasta
提取peaks的序列
bedtools getfasta -fi
ref_genome.fa
-bed Nanog-idr-merged-great.bed
-fo Nanog-idr-merged-dreme.fasta
GREAT(http://bejerano.stanford.edu/great/public/html/index.php)对peaks的功能注释是对peaks临近基因的注释。
方法:
Nanog-idr-merged-great.bed
文件,选择参考基因组,选择Whole genome
作为背景区域,然后点击Submit
。Job Description
,选择View all genomic region-gene associations
,结果中的两个表给出peaks注释到的基因,一个是基因组区域和基因关联的表,一个是基因和基因组关联的表:Region-Gene Association Graphs
Global Controls
This term\'s genomic region-gene association tables (140 regions, 116 genes)
,查看注释到的GO term相关的基因,可以下载表格。This term\'s gene -> genomic region association table
中点击基因相关的regions,可以在UCSC浏览器上直接查看结合区域。
motif是比较有特征的短序列,会多次出现的,并被假设拥有生物学功能。而且,经常是一些具有序列特异性的蛋白的结合位点(如转录因子)或者是涉及到重要生物过程的(如,RNA 起始,RNA 终止, RNA 剪切等等)。
有很多网页版工具提供了找motif的方法,2014年的一篇综述列出了目前常用的网页工具(https://doi.org/10.1186/1745-6150-9-4 ):
Nanog-idr-merged-dreme.fasta
即可,同时可以写上email和每个任务的描述,任务完成时如右图所示,可以打开DREAM_HTML_output查看结果。More
可以查看更多的信息。Submit / Download
,然后选择Tomtom
,点击Submit
,在新打开的Tomtom界面可以选择转录因子的参考数据库,保持默认参数不变,也可以再添加其他参数,输入邮箱和任务描述就可以开始搜索。
MEME-ChIP是MEME套件中的另一个工具,可以实现DREAM和Tomtom的分析功能,还可以评估motifs的中心富集性并整合相关的motifs合成相似性簇。MEME-ChIP能够鉴定更长的motifs(<30bp),但是运行时间比较长。