首页 > 科研教程 > 史上最全转录因子数据库汇总解读
2024
02-10

史上最全转录因子数据库汇总解读

一、转录因子介绍

转录因子(Transcription factors)是一群能与基因特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。转录因子通过识别特定的DNA序列来控制染色质和转录,以形成指导基因组表达的复杂系统。接下来我们来回顾一下有哪些值得上车的转录因子数据库吧:

二、转录因子数据库汇总解读

No.1

Cistrome DB

http://cistrome.org/db/#/

Cistrome DB总共收录了30451人和26013小鼠的转录因子、组蛋白修饰和染色质可及性样本,可以说是目前最全面的研究ChIP-seq和DNase-seq的数据库。我们可在Cistrome DB查看转录因子调控的基因,详细的数据注释、分析结果和单个数据集的详细信息(数据的QC情况、motif分析结果、潜在的靶基因预测)、同时还可以在基因组浏览器中查看数据的分布及下载分析的结果文件。


No.2

dbCoRC

http://dbcorc.cam-su.org/

dbCoRC是第一个全面的交互式CRC数据库,也是核心启动因子数据库。它基于H3K27ac ChIP-Seq数据的计算分析,包含来自188个人类和50个鼠类样本的CRC模型。利用该数据库,我们可以获得单个样品的超级增强子(SE)、增强子和H3K27ac景观、CRC内SE区中每个核心转录因子(TF)的假定结合位点。dbCoRC还可作为研究生理(非疾病)和疾病状态下的转录网络和调控回路的宝贵资源。


No.3

TRRUST

http://www.grnpedia.org/trrust/

TRRUST是一个人工注释的转录调控网络数据库,不仅包含转录因子对应的靶基因,也包含了转录因子间的调控关系,并且提供的TF-target互作信息。TRRUST目前包括两个物种:人和小鼠,分别包含800个人类TF和828个小鼠TF的8,444和6,552个TF目标调节关系。它们源自11237篇发表的文章,其中描述了转录调控的小规模实验研究。为了有效地从超过2000万篇发表的文章中搜索监管关系,我们使用了基于句子的文本挖掘方法。TRRUST数据库还提供调节模式(激活或抑制)的信息,已知有8,972个调控信息,占比59.8%。


No.4

TransmiR

http://www.cuilab.cn/transmir

TransmiR是收集转录因子(TF)-microRNA(miRNA)的数据库,通过它我们可以找到TF和miRNA之间的调控关系。目前,ransmiR v2.0包含3,730个文献策划的TF-miRNA法规,涵盖约623个TF,约785个miRNA,19种生物和1,349种出版物。此外,还提供了来自5种物种的ChIP-seq证据得出的1,785,998 TF-miRNA信息,详细注释了所有TF-miRNA内容,还包括来自miRNA目标数据库TarBase和miRTarBase的经过实验验证的miRNA-TF反馈信息。


No.5

JASPAR

http://jaspar.genereg.net/#

一个DNA结合蛋白可能对应多个motif,motif也会对应多个蛋白,JASPAR正是收录了这些结合信息。JASPAR是一个免费公开的转录因子数据库,收集转录因子与DNA结合位点以及结合方式。共收集了脊椎动物、植物、昆虫、线虫、真菌和尾索动物六大类不同类生物的数据,可以用来预测转录因子与序列的结合区域。里面有9个子数据库,各库内容针对不同,对应不同来源和类别的转录因子信息。


No.6

footprintDB

http://floresta.eead.csic.es/footprintdb/index.php

footprintDB是一个转录因子综合数据库,收录了8754个去冗余的转录因子,整合了JASPAR在内的9个数据库的9350个转录因子、13682个DNA motifs和35058个DNA结合位点数据,存储了transcription factors, DNA motifs, DNA binding sites3种信息。通过这个数据库,我们能够预测结合特定DNA位点或基序的转录因子,以及可能被特定DNA结合蛋白识别的DNA基序或位点。


No.7

AnimalTFDB

http://bioinfo.life.hust.edu.cn/HumanTFDB/#!/

AnimalTFDB有经过鉴定、分类和注释的97个物种全基因组水平的125,135个TF基因和80,060个转录辅因子基因。在里面我们可以查到动物的转录因子注释和预测数据。AnimalTFDB根据转录因子DNA结合结构域(DBD),将TF进、TF辅助因子功能分类。还提供多种搜索浏览方式(Famliy、Species或自定义搜索)、2个在线预测工具Predict TF和Predict TFBS(分别可以批量预测转录因子和预测DNA序列上的转录因子结合位点)、Blast工具和数据下载功能,非常实用。


No.8

HOCOMOCO

https://hocomoco11.autosome.ru/

HOCOMOCO是专门研究人和小鼠的数据库,团队从超过5000个针对人类和小鼠转录因子的实验中获得的14000多套ChIP-Seq数据集,进行系统化的基序发现和交叉验证。目前,HOCOMOCO 共收集了680个人和453个鼠转录因子的结合model,其中包含1302个单核苷酸和576个二核苷酸的位置权重矩阵。利用这种大规模的分析可以极大地扩展和改善针对人和小鼠转录因子的TFBS模型的非冗余集。


No.9

hTFtarget

http://bioinfo.life.hust.edu.cn/hTFtarget#!/

TFtarget整合了699个转录因子的高可信度DNA结合序列,其中包含699个TF的2737个TFBS基序,是人类TF-target目前最全面的数据库。整合大规模的人类转录因子靶基因数据之外,还构建了开源的人类转录因子靶基因数据库,分析了转录因子的细胞系特异性调控、转录因子间的协作调控等,为TF-target调控的研究提供了近似的一站式解决方案。hTFtarget应用了两种不同的策略来检测TF-target信度,包括ChIP-Seq数据分析和转录因子结合位点(TFBS)扫描。


No.10

KnockTF

http://www.licpathway.net/KnockTF/

转录因子敲降/敲除前后的基因表达谱分析是获得转录因子靶基因、探索转录因子功能的最重要策略之一。KnockTF是人的全面基因表达谱TF击倒/基因敲除数据库,它提供了大量与转录因子敲降/敲除相关的人类基因表达谱数据集、转录因子及其靶基因的注释信息、转录因子的上游通路信息和下游靶基因的功能注释信息,以及转录因子绑定到靶基因启动子、增强子和超级增强子的详细绑定信息。


https://www.bilibili.com/video/BV19H4y1K7Kj/


最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情