传统的全基因组关联分析,是直接阐述DNA与外在表型间的关联。但这一方法也存在一些不足。
传统GWAS的不足
1
难以确定具体功能突变
由于连锁不平衡的作用,与特点性状关联的区域往往具有较大的宽度,从而难以确定具体功能突变。如下图[1],氯吡格雷GWAS分析的结果咋一看是个细峰,实际放大后你会发现这个峰具有1.5Mb的宽度。
峰的区域内涵盖了CYP2C18- CYP2C19-CYP2C9- CYP2C8 4个基因的基因簇。仅仅凭关联分析的结果,我们可能还无法确定候选目标基因以及目标突变。
图1 心血管药物氯吡格雷代谢机制关联分析的结果
2
难以解析DNA突变如何影响性状的具体机制
因为从DNA到高阶表型之间还有大量的中间调控机制,突变如何影响性状还有很多可能性。
尤其大部分GWAS得到的显著关联区域位于非编码区的情况下,如果没有找到非编码区调控的具体中间分子,解析其调控机制将会非常困难。
3
有些高阶表型难以定性定量
某些外在高阶表型,定性定量难度大,给大样本的表型鉴定的时候带来困难。例如,水果的风味鉴定。
贯穿分析的优点
实际上从DNA分子到影响外在表型之间,要经历表观组、转录组、蛋白组、代谢组等多个路径。在传统GWAS的基础上,加入解析DNA突变与潜在对性状有影响的中间分子(例如mRNA表达量)间的关系,将可以解决以上的问题。其主要体现在:
1
数据解析的维度增加
由于加入了中间性状,数据的解析从单线(仅仅DNA-表型的关系)升级为多维度(基因型-中间分子,中间分子-表型),这有助于在传统GWAS分析的基础上缩小候选基因的范围。
2
多维度的数据结果
多维度的数据,也为解析基因突变影响具体高阶表型的内在机制提供了可能。
3
分子表型定量更准确高效
处于中间的分子表型,相比外在的抽象的高阶表型(例如,抗病性、风味、性状等)更容易被高效、准确地定量,从而减少误差,有利于统计学上得到更显著的结果。
而且根据上个小节提到的相关性传递原理,相比高阶表型,中间分子表型离DNA基因型更近,也进一步有利于得到更显著的关联结果。
所以,针对以各种各样的中间分子表型开展关联分析,也成为了近年来关联的研究热点——xGWAS。如图2,如果以转录组为中间表型,开展基因表达与基因型的关联分析,找到的控制基因表达的染色体位点,就被称为expression QTL(eQTL)。
如果这个中间表型是DNA甲基化,就被称为methylation QTL(mQTL);如果这个中间表型是代谢组,则可以称为metabolite QLT(也是mQTL,好像有重名啦哈,还是慎用简称的好
)。
图2 整合多种类型的组学数据解析基因型-表型间的关联
以eQTL类的研究为例,有时候可以帮助我们解析看似难以解释的非编码区调控现象。例如,在人类的GWAS研究中,位于基因CELSR2 的3’UTR区的若干个SNP与血清低密度脂蛋白胆固醇(LDL-C)相关,是与心肌梗死(MI)相关的风险位点。
如果按照一般的逻辑理解,我们或许会以为是3’UTR区的突变,影响了miRNA的调控,从而影响CELSR2的翻译,最终导致疾病。但通过eQTL分析以及后续的多群体重复验证,研究人员发现表达量与这个区域的突变最相关的基因不是CELSR2,而是位于这个3’UTR区40k下游的SORT1。
虽然最显著相关的SNP rs12740374看似位于基因CELSR2内,但这个位点缺失转录因子C/EBP的结合位点。这个位置的突变,直接影响了其下游40k处的SORT1的表达(中间隔了两个编码基因,居然还能调控到,应该是染色体的三维结构有关),从而影响LDL-C的代谢。这么骨络清奇的发现,自然在当年也发表在《nature》上[2]。类似这样的发现,为我们解析编码区突变的潜在机制,提供了不少启发。
图3 3’UTR区的突变影响转录因子结合,从而调控下游基因表达
再例如,代谢组就往往可以被作为代表外在高阶表型的标记物。在西红柿风味研究的的文章中[3],作者就是先通过代谢物和风味的关联分析,找到决定西红柿风味的物质是糖类、有机酸和挥发性物质。然后再以这些影响风味代谢分子作为分子表型,与DNA水平开展关联分析,找到调控这些分子的决定基因。这项研究有两大亮点:
a)将难以量化、难以大规模高效鉴定的“风味”转为简单、容易量化评估的分子代谢物,有利于后续育种应用过程中开展大规模检测;
b)将抽象的风味概念,转为为直观解释的影响风味的代谢物(糖类、有机酸等),更便于从分子水平解析果实风味变化的机制。
图4 西红柿风味的研究思路
具体的这篇文章解读见《science文章解读:mGWAS+mQTL 研究番茄遗传机制》,大家也可以通过点击“阅读原文”查看。
随着测序价格不断下降,类似这样有趣又能解决问题的xQTL研究,一定会越来越多。那么,在解析突变如何影响性状这个问题上,就会有越来越多的思路。
拓展阅读
参考文献:
[1]Shuldiner A R, O’Connell J R, Bliden K P, etal. Association of cytochrome P450 2C19 genotype with the antiplatelet effectand clinical efficacy of clopidogrel therapy[J]. Jama, 2009, 302(8): 849-857.
[2]Musunuru K, Strong A, Frank-Kamenetsky M, etal. From noncoding variant to phenotype via SORT1 at the 1p13 cholesterollocus[J]. Nature, 2010, 466(7307): 714-719.
[3] Tieman D, Zhu G, Resende M F R, et al. Achemical genetic roadmap to improved tomato flavor[J]. Science, 2017,355(6323): 391-394.- 本文固定链接: https://maimengkong.com/zu/1509.html
- 转载请注明: : 萌小白 2023年5月2日 于 卖萌控的博客 发表
- 百度已收录