前言
2020 年 8 月 27 日,欧易生物与中南大学基础医学院法医系主任郭亚东课题组合作项目,以题为“Chromosome‐level de novo genome assembly of Sarcophaga peregrina provides insights into the evolutionary adaptation of flesh flies”发表在 Molecular Ecology Resources (IF: 6.286),该研究首次获得了棕尾别麻蝇高质量的参考基因组,该基因组将有助于肉蝇的适应性进化和系统发育研究。
中南大学基础医学院任立品博士为第一作者,文章中基因组组装和比较基因组分析由欧易生物协助完成。
研究背景
棕尾别麻蝇(Sarcophaga peregrina),俗称肉蝇,隶属于双翅目麻蝇科,常以腐肉为食,其生态习性与人类生活密切相关。由于其特殊的繁殖方式(卵胎生/卵寄生),麻蝇在与腐烂尸体相关的法医调查中发挥着至关重要的作用。同时麻蝇也具有重要的生态学作用,可以作为人类和牲畜肠道传染病和寄生虫的媒介之一。目前麻蝇科内物种基因组信息较少,制约了这一类重要物种的研究。
研究技术
材料:野生棕尾别麻蝇近交 6 代后,用于进行基因组 de novo 测序
测序技术:Illumina,PacBio (110x),Hi-C (300x)
研究结果
1. 基因组测序和组装
经流式细胞仪检测计算,棕尾别麻蝇基因组大小约为 529.7 Mb;基因组 survey 测序预估杂合度为 2.92%,组装之后 GATK 进行 SNP calling,杂合率为 1.65%。
利用 PacBio 获得了 57.83 Gb subreads (subreads N50 = 13.90 Kb),subreads 经过 Canu v1.6 组装并经Arrow v 2.1.0 polish 后,获得的棕尾别麻蝇基因组大小为 560.31 Mb,Contig N50 = 3.84 Mb。通过 BUSCO 评估,组装出了 97.1% 的完整单拷贝基因。
结合 Hi-C 数据,利用 Juicer 和 3D-DNA 进行染色体挂载,最终获得的基因组大小为 548.19 Mb,挂载到6条染色体,挂载率为97.96%,BUSCO 评估显示组装出了 97.4% 的完整单拷贝基因,说明组装结果比较完整。
图片说明:棕尾别麻蝇基因组的组装统计
图片说明:棕尾别麻蝇全基因组(包含6条染色体)Hi-C 互作热图
图片说明:棕尾别麻蝇与黑腹果蝇的基因组共线性比较
2. 基因注释
利用 Augustus v3.0、SNAP、GlimmerHMM、GeneID 进行基因结构的 de novo 预测,通过结合转录组测序数据利用 PASA 和 TopHat 进行基因结构的预测,并利用 EVidenceModeler 进行基因模型的整合。最终获得 15,710 个基因(其中 14,476 个蛋白编码基因),平均每个基因含有 3.94 个外显子,平均转录本长度、CDS 长度、外显子长度分别为 7635.25 bp、1404.03 bp、356.4 bp。通过与 NR、Swissprot、TrEMBL、KEGG、KOG、GO、Pfam、InterProscan 数据库比对进行了基因的注释。通过 Rfam、TRNAscan-SE、RNAmmer,对 miRNAs、rRNAs、snRNAs、tRNAs 进行注释。
为了识别串联重复序列和转座元件,使用 RepeatMasker、RepeatProteinMask 和Tandem Repeat Finder 对重复序列进行注释。结果显示重复序列约占棕尾别麻蝇基因组 45.70%,其中 DNA 转座子约占 12.35%。同时利用 MicroSAtellite Identificaiton Tool 在基因组中鉴别到 456,324 个 SSRs。
3. 基因家族鉴定和系统发育分析
使用 DIAMOND,将蚊科的埃及伊蚊和冈比亚伊蚊,棕尾别麻蝇和其他 9 种双翅目物种蛋白质序列进行比对,使用 OrthoFinder 进行比对结果的聚类。结果显示,在棕尾别麻蝇中共鉴别到 9,636 个基因家族(包含 13,039 个基因),其中 13 个基因家族(106 个基因)是该物种所特有的。
图片说明:棕尾别麻蝇基因家族鉴定结果
通过 MAFFT 和 Gbolcks 对 5,622 个单拷贝基因家族进行比对,利用 RAxML 进行系统进化树构建,利用 MCMCTREE 估计分化时间,结果显示 8 种蝇类聚集成一个大支,麻蝇科和丽蝇科亲缘关系最近,它们之间的估计分化时间为 32.53 百万年。而在麻蝇科内,棕尾别麻蝇和 S. bullata 亲缘关系最近,它们约在 7.14 百万年之间从共同祖先分化而来。
4. 基因家族的扩张与收缩
利用 Computational Analysis of Gene Family Evolution(CAFE) 进行基因家族的扩张与收缩分析,结果显示 1,191 个基因家族发生收缩、568 个基因家族发生扩张,这些基因主要参与水解酶合成、氨基酸代谢、脂肪酸合成酶活性等信号通路。692 个基因受到了正选择,它们主要参与脂肪酸α-羟化酶活性、表皮形态发生、转移酶活性等。
图片说明:棕尾别麻蝇的基因家族扩张与收缩分析结果
研究结论
本研究首次组装获得了棕尾别麻蝇染色体水平的基因组,基因组结构和功能分析揭示了肉蝇系统发育的多样性。该基因组不仅为揭示棕尾别麻蝇和其他食腐肉物种的适应性进化提供了重要的资源,也为进一步研究昆虫进化在大规模系统发育工程中的应用填补了空白。
参考文献
Ren L, Shang Y, Yang L, et al. Chromosome-level de novo genome assembly of Sarcophaga peregrina provides insights into the evolutionary adaptation of flesh flies. Mol Ecol Resour2020; doi: 10.1111/1755-0998.13246.
END
本文系欧易生物原创
转载自欧易生物- 本文固定链接: https://maimengkong.com/kyjc/1447.html
- 转载请注明: : 萌小白 2023年4月16日 于 卖萌控的博客 发表
- 百度已收录