首页 > 科研教程 > 干货 | 如何确定物种是否有参考基因组(一)
2021
07-31

干货 | 如何确定物种是否有参考基因组(一)

所研究物种是否有可用参考基因组是做转录组测序之前需要确认的第一个问题,这决定了我们是做有参转录组测序还是无参转录组测序。有参转录组项目会将测到的转录本序列直接比对到参考基因组,以确定基因信息;无参的话,我们就需要借助拼接软件,获得unigene集后去做注释来获得基因信息。

基因组只有序列信息可以做为转录组测序的参考基因组吗?答案是不能哦!转录组测序的参考基因组不仅需要有序列信息,还要有对应的结构注释以及功能注释。

说了这么多,进入正题吧!在不知道物种是否有能参考基因组的情况下,首先推荐大家在3大主流基因组网站进行查询:

一、Ensembl数据库:

http://ensembl.org/index.html

由EuropeanBioinformaticsInstitute(EBI)与WellcomeTrustSangerInstitute(WTSI)共同合作开发。物种丰富且更新及时,其基因组文件整理最方便做转录组分析啦,深得生信工程师恩宠!

以动物的页面为例,人、小鼠和斑马鱼这类的常用模式物种,我们可以直接点进去看基因组信息。若ensembl数据库中有收录我们要查的物种基因组,点击view full list of all Ensembl species,我们可以在list中找到我们关注的物种,如果列表中没有、可直接在搜索框搜索(图1、图2)。很多物种拥有不止一个基因组版本,不同基因组版本可能来源于不同的基因组项目,或对应这不同的亚种,进入相应物种页面之后,我们可以进入到不同的基因组链接中进行查看,例如小鼠不同株系的细胞,也是需要在该位置点击株系列表浏览(图3)。

图1:

图2:

图3:

除了动物的以外,将页面拉到最下方,有植物,真菌以及细菌基因组库的超链接哦(图4)!

图4:

二、NCBI数据库:

https://www.ncbi.nlm.nih.gov/

NationalCenterforBiotechnologyInformation拥有较全面的基因组,比ensembl更被大家所熟悉。

与Ensembl不一样,NCBI的基因组搜索栏可以搜索所有类型的物种。在条件栏选择genome,然后输入目标物种拉丁名,点击后方search就能进入对应的基因组页面啦,是不是很方便(图5)!

图 5:

这里要注意哦,不是所有搜到的基因组都能作为参考基因组,必须要有完整的注释信息才行。当目标物种不止一个基因组时,我们需要浏览基因组列表(图6),进入到列表之后,有gene以及protein注释的才能作为转录组的参考基因组(图7)。原核物种的参考基因组要具体到菌株,所以要看目标菌株是否有参。无参的话也不要紧,做个完成图或者框架图就可以作为转录组的参考基因组啦(图8)!

图 6:

图 7:

图 8:

另外,搜索有些物种基因组的时候你会看到以下画面(图9),这里并不能直接看到gene与protein信息,一般这种情况下表明基因组缺少注释信息,这个可以进一步查看genebank assembly进行核实(图10),看显示文件中是否有cds,protein及RNA等注释文件,发现该基因组确实缺少注释信息,只有基因组序列信息(图11)。

图 9:

图10:

图 11:

三、UCSC数据库:

http://genome.ucsc.edu

由University of California Santa Cruz创立和维护,主要包含了人类、小鼠及果蝇等常见动物基因组信息(图12)。使用率低于前两个基因组数据库。对于不常见的物种,优先选择前两个数据库搜索基因组。

图 12:

未完待续,更多精彩敬请期待哦

最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情