首页 > 科研教程 > 生信计算100+ 数据库:涉及蛋白、代谢、GWAS、动植物、病毒、细菌...
2025
10-06

生信计算100+ 数据库:涉及蛋白、代谢、GWAS、动植物、病毒、细菌...

❝分享100+数据库——涉及1)基因序列、表达、调控;2)蛋白质结构、功能、家族、互作和通路;3)代谢物;4)专业数据库——动植物、微生物、细菌、病毒;和5)疾病特异性数据库。

序列数据库

核酸序列数据库

Nucleotide@NCBI – 来自多个来源的序列数据库,包括 GenBank、RefSeq、TPA 和 PDB。

ENA@EBI – 欧洲核苷酸档案馆全面记录世界核苷酸测序信息。

DDBJ – 日本的核苷酸序列数据库。

蛋白质序列数据库

PIR – 蛋白质信息资源是一个综合的公共生物信息学资源,用于支持基因组、蛋白质组和系统生物学研究。

Protein@NCBI – 多个来源的序列数据库,包括 GenBank、RefSeq 和 TPA 中注释编码区的翻译,以及 SwissProt、PIR、PRF 和 PDB 的记录。

UniProt – 蛋白质序列和功能信息数据库。

基因数据库

Entrez Gene – 整合来自多种物种的信息。

GeneCards – 所有注释和预测的人类基因的综合数据库。

基因预测服务器

Genscan – 鉴定基因组 DNA 中完整的基因结构。

GeneMark – 细菌、古细菌、宏基因组和宏转录组的基因预测。

GENEID –用于预测 DNA 序列上的基因、外显子、剪接位点和其他信号。

AUGUSTUS – 用于预测真核基因组序列中的基因。

EuGene – 真核和原核基因组的综合基因查找器。

基因组数据库和浏览器

NCBI Genome – 组织基因组信息,包括序列、图谱、染色体、组装和注释。

ENSEMBL – 脊椎动物基因组的基因组浏览器。

UCSC 基因组浏览器– 集成了加州大学圣克鲁斯分校大量基因组的参考序列和工作草案组件。

Phytozome – 植物比较基因组学门户。

Gramene – 作物和模型植物物种比较功能基因组学资源。

NCBI Genome Data Viewer – 用于探索和分析真核 RefSeq 基因组组装的基因组浏览器。

VISTA – 用于基因组序列比较分析的综合程序和数据库套件。

GOLD – 基因组在线数据库,是一个万维网资源,用于全面访问有关基因组和宏基因组测序项目及其相关元数据的信息。

MITOMAP – 人类线粒体基因组数据库。

基因组分析

GeneCensus – 代谢通路活性和蛋白质家族共享方面的基因组比较。

GWAS Catalog – 人类全基因组关联研究的 NHGRI-EBI 目录。

UCSC Xena – 一种用于公共和私人、多组学和临床/表型数据的在线探索工具。

基因表达和调控数据库

基因表达数据库

GENT2 – 正常和肿瘤组织的基因表达数据库。

GEO@NCBI – 基因表达综合存储库包含来自精选数据集的单个基因表达谱。

Allen Brain Atlas - 基因表达和神经解剖数据。

TCGA – 癌症基因组图谱提供了用于可视化、查询和下载联盟成员项目每季度发布的数据的工具。

Cell Miner – 专为癌症研究设计的数据库和查询工具。

Expression Atlas - 提供有关基因和蛋白质表达的信息。

基因调控数据库

miRBase – microRNA 数据库是已发布的 miRNA 序列和注释的可搜索数据库。

TRANSFAC – 提供有关真核转录因子、其经实验证明的结合位点、共有结合序列(位置权重矩阵)和调控基因的数据。

DBTSS – 转录起始位点数据库。

ENCODE – 一个公共研究联盟,旨在识别人类和小鼠基因组中的所有功能元件。

蛋白质结构数据库

蛋白质 3D 结构数据库

PDB – 蛋白质数据库档案 - 有关蛋白质、核酸和复杂组件的 3D 形状的信息。

Structure@NCBI – NCBI 的蛋白质 3D 结构存储库。

PDBe@EBI – EBI 大分子结构数据库。

PDBSum@EBI – EBI 的 PDB 摘要数据库。

MMDB@NCBI – NCBI 维护的大分子数据库。

BMRB – 生物磁共振数据库。

SCOP – 蛋白质结构分类旨在提供所有已知蛋白质结构之间的结构和进化关系的全面描述。

CATH – 钙化、结构、拓扑和同源超家族的数据库。

蛋白质结构域、功能、表达和家族数据库

蛋白质结构域数据库

InterPro – 提供蛋白质序列功能分析的资源。

CDD – 保守蛋白质结构域的数据库。

ProDom – 从 UniProt 知识数据库自动生成的全面蛋白质结构域家族数据库。

SMART – 简单的模块化架构研究工具。它允许遗传移动域的识别和注释以及域架构的分析。

HPA – 人类蛋白质图谱借助免疫组织化学显示了多种正常人体组织、癌细胞和细胞系中蛋白质的表达和定位。

蛋白质家族数据库

PFam – 蛋白质家族的大集合。

PROSITE – 蛋白质家族和结构域的数据库。

RFam – RNA 家族数据库,以多重序列比对、共有二级结构和协方差模型为代表。

DFam – 转座元件 DNA 序列比对、隐马尔可夫模型 (HMM)、共有序列和基因组注释的数据库。

TreeFam – 由从动物基因组推断的系统发育树组成的数据库。

相互作用和通路数据库

蛋白质相互作用数据库

STRING@EMBL – 用于蛋白质-蛋白质相互作用的网络服务器。

BioGRID – 蛋白质、遗传和化学相互作用数据库

STITCH@EMBL – 用于化学-蛋白质相互作用的网络服务器。

REACTOME – 一个开源、开放访问、手动策划和同行评审的路径数据库。

DAVID – 用于注释、可视化和集成发现的数据库

通路数据库

KEGG – 手动绘制的通路图的集合。

PathGuide – 一个元数据库,提供 190 多个可通过网络访问的生物途径和网络数据库的概述。

Pathway Commons – 来自多种生物体的公开途径信息的集合。

PhosphoSitePlus – 用于研究蛋白质翻译后修饰的综合信息和工具。

METscout – 数据库汇集了新陈代谢和基因表达景观。

代谢物数据库

代谢物数据库

HMDB – 人类代谢组数据库。

KEGG LIGAND 数据库–与生命相关的化学物质和反应的数据库。

KNApSAcK – 综合物种-代谢物关系数据库。

LIPID MAPS - 脂质代谢物和途径策略。提供对脂质命名法、数据库、工具、方案、标准、教程、会议、出版物和其他资源的访问。

MassBank – 高质量质谱数据库。

MetaCyc – 它是一个精心策划的数据库,包含生命各个领域的实验阐明的代谢途径。

METLIN – 代谢物信息和串联质谱数据的存储库,旨在促进代谢组学中代谢物的识别。

专业数据库

细菌基因组数据库

PATRIC – 病理系统资源整合中心提供集成数据和分析工具,以支持细菌传染病的生物医学研究。

BacDive – 细菌多样性元数据库是世界上最大的标准化细菌信息数据库。

病毒基因组数据库

Viral Genomes – NCBI 的病毒基因组信息资源。

GISAID – 禽流感数据共享全球倡议。

NCBI Flu – 流感病毒资源,包含流感基因组数据和分析工具。

Plant Viruses – 该网站提供有关植物、真菌和原生动物的病毒、类病毒和卫星的信息的中心来源。

微生物数据库

ECMDB – 大肠杆菌代谢组数据库,包含大肠杆菌(菌株 K12、MG1655) 发现或产生的小分子代谢物。

IMG – 集成微生物基因组系统是在综合比较背景下对基因组和宏基因组数据集进行分析和注释的资源。

LoQAtE – 酵母蛋白质组的定位和定量图谱。

植物数据库

PlantTFDB – 植物转录因子数据库。

TAIR – 拟南芥信息资源 (TAIR) 是模型高等植物拟南芥的遗传和分子生 物学数据数据库。

AraPort – Araport 是拟南芥基因组学的网络服务器。

IC4R – 一个精心策划的数据库,提供水稻基因组序列、更新水稻基因注释并通过社区贡献的模块整合多个组学数据。

Oryzabase – 综合性水稻科学数据库。

MaizeGDB – 玉米遗传学和基因组数据库

SoyBase – 为大豆研究人员整合遗传学和分子生物学。

SGN – 茄科基因组网络是茄科物种的数据资源,包括番茄、马铃薯、辣椒、茄子、矮牵牛、烟草。

CuGenDB – 国际葫芦基因组计划的网络资源,包括甜瓜、黄瓜、西瓜、南瓜等。

GDR – 蔷薇科基因组数据库,提供蔷薇科数据挖掘工具和公开的基因组学、遗传学和育种数据。

GoMapMan – 植物科学中基因功能注释的资源。

NPACT – 具有抗癌活性的植物衍生天然化合物的精选数据库。

PGDD – 用于根据基因组内或跨基因组同线性关系来识别和编目植物基因的数据库。

PIECE – 25 个物种的植物基因结构比较和进化数据库

PlantRNA – 植物和藻类 tRNA 序列数据库。

PlnTFDB – 植物转录因子数据库提供了完整测序植物中假定的完整转录因子 (TF) 集和其他转录调节因子。

PMRD – 植物 microRNA 数据库集成了公开可用的植物 miRNA 数据。

SALAD – 用于植物比较基因组学的基于基序的蛋白质注释数据库。

模式生物数据库

MGI – 实验室小鼠的国际数据库资源。

RGD——大鼠基因组数据库。整合了大鼠研究中产生的遗传、基因组、表型和疾病相关数据。

XenBase – 集成了非洲爪蟾研究中可用的所有不同的生物学、基因组、基因型和表型数据。

Zfin – ZFIN 用作斑马鱼模式生物数据库。

FlyBase –果蝇基因和基因组的主要存储库

OnTheFly –果蝇转录因子 DNA 结合特异性的数据库 。

FlyAtlas – 果蝇基因表达图谱。

WormBase – 整合有关线虫和相关线虫的遗传学、基因组学和生物学的信息

SGD –酵母基因组数据库

BDGP – 伯克利果蝇基因组计划

BeeBase – 蜜蜂研究界的综合序列数据源。

PomBase – 粟酒裂殖酵母的综合数据库。

AtMAD – 拟南芥多组学协会数据库。

ZInc – 斑马鱼突变数据库。

OikoBase – Oikopleura dioica 的精选基因组表达数据库 。

人类病原体无脊椎动物载体数据库

VectorBase – 人类病原体无脊椎动物载体数据库。包括参考和变异基因组序列、结构和功能注释以及杀虫剂抗性等性状的表型和群体数据。

疾病特异性数据库

AudGenDB – 听力学和遗传数据库

EDKB – 内分泌干扰物知识库

HGMD – 人类基因突变数据库

NIAID——国家过敏和传染病研究所

OMIM——在线人类孟德尔遗传。人类基因和遗传疾病在线目录

PC-GDB – 胰腺癌基因数据库。有关引起胰腺癌的基因的最新信息。

Pancreatic Cancer Database - 实验证明与癌组织或癌细胞系中胰腺癌相关的分子改变的资源。



最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情