首页 > 组学教程 > 群体遗传进化专题之选择性清除分析
2023
04-25

群体遗传进化专题之选择性清除分析

所谓选择性清除:当一个有利突变发生后,这个突变基因的适合度越高,就越容易被选择固定。当这个基因被快速固定之后,与此基因座连锁的染色体区域,由于搭车效应也被固定下来,大片紧密连锁的染色体区域因此失去多态性,这种由于搭车效应引起多态性下降的现象,遗传上称为选择清除。


下图可以形象的展示受选择后的结果。



    

圈子不同,别瞎凑合。


二、来看看都有哪些形式的选择清除结果展示

1、FST挖掘人工驯化过程中受选择的基因--74份中国李核心种质可聚类为南、北、东北及国外品种群,南方品种群较为原始,遗传多样性丰富,且与其他品种群间存在基因交流,推测中国李起源于我国南方长江流域。不同品种群间进行选择压分析,共鉴定到35个受选择位点,其中,开花调控、抗病抗逆及类黄酮代谢等重要途径关键基因显著富集,初步揭示了中国李重要性状驯化的分子基础。

纵坐标如Fst(F_S),表示该结果是F群体与S群体间的分化指数,这里对FST做了一个Z变换,所以数值范围不是[0~1],但值越大也是分化越显著区域。图上可直观看到分化指数较高的位置。


2、挖掘物种适应性进化中受选择的基因--野外收集到的各亚种间在遗传物质上有何差异,不妨来看看借助选择性清除探究“只有长江江豚可以在淡水中生活的奥秘”?

采用Sweep Finder2软件基于CLR(复合似然比),来探测群体内的选择信号,鉴定出39 个具有强选择性扫描信号的 CLR 峰,宽、窄脊江豚分别鉴定出218 个和 144 个候选基因。

为什么本文选择CLR来进行,原因在于常用于选择性清除的分析如FST适合物种内,不适合物种间、而Ka/Ks整合难度大,故本文采用了优化后的SFS原理。如果您的样本于此类似,不妨参考参考。


3、揭示芥菜百变形态之源--选择性清除分析+GWAS

利用选择消除分析对不同类群的基因组选择区域进行了鉴定,同时开展全基因组关联分析,发现了12个共同的控制开花期候选基因,对其中2个候选基因VIN3和SRR1进行单倍型分析,发现它们在芥菜的传播和驯化过程中共同进化,揭示了芥菜在开花期上对环境的适应。对籽用、茎用和根用芥菜形态变异的基因组选择区域和候选基因进行分析,发现芥菜中适应了当地光周期的基因导致了种子大小的改变,生长素信号传导、糖转运、细胞分裂和细胞扩张等方面的基因决定根、茎膨大。


4、XP-CLR、π、Tajima’s D多种参数结合的选择性分析结果

栽培苹果具有人工驯化的很多痕迹,特别是其中的果实重量、硬度、甜度、酸度等。通过XP-CLR、π、Tajima’s D相结合的方法定位到6号染色体上的包含9个基因的区域内。

上图a中灰色背景点表示起源于其他野生祖先而不是来自比较的基因组,绿色的线为XP-CLR前1%的分位数。


三、常见名词

A、Ka/Ks
The ratio of the number of nonsynonymous substitutions per nonsynonymous site (Ka) to the number of synonymous substitutions per synonymous site (Ks)。其中:
Ks = 同义突变SNP数/同义位点数, 即同义突变率

Ka = 非同义突变SNP数/非同义位点数, 即非同义突变率

Ka/Ks >> 1,基因受正选择(positive selection)

Ka/Ks =1,基因中性进化(neutral evolution)

Ka/Ks << 1,基因受纯化选择(purify selection)

用于计算Ka/Ks的软件:KaKs_Calculator、PAML、Hyphy、MEGA等。

B、FST
FST:遗传分化指数,取值范围是[0,1],最大值为1表明两个群体完全分化,最小值为0表明群体间无分化。

在实际的研究中Fst值为0--0.05时说明群体间遗传分化很小,可以不做考虑;

为0.25以上的时候群体间就存在很大的遗传分化了.

C、π:表示核苷酸多态性,受选择程度越高,多态性越低。


D、Tajima’D:在标准中性进化模型下,Tajima's D的理论值为零。

如果Tajima's D>0,表明存在大量的中等频率的等位基因,这可能是由于群体瓶颈效应,群体结构,或者平衡选择引起的。

如果Tajima's D< 0,表明存在大量的低频等位基因位点。Tajima's D分析表示中性进化,越偏离0,受选择程度越高。


E、XP-CLR :全称是 the cross-population composite likelihood ratio test(跨群体复合似然比检验),是一种是基于选择清除(selective sweep)的似然方法。XP-CLR 利用了两个群体之间的多基因座等位基因频率差异(multilocus allele frequency differentiation)建立模型,使用布朗运动来模拟中性下的遗传漂移,并使用确定性模型来近似地对附近的单核苷酸多态性(SNPs)进行选择性扫描。



四、总结

春花秋月、沧海桑田,我们身边丰富的物种都经历了从野生祖先种到地方种的驯化过程,再经过近代育种家的不断改良,提高其产量,改良其食味、品质和株型或者物种为生存,适应环境,不断自我修炼;相比于漫长的驯化过程,作物改良在短短几十年间取得的成就大大超越以前的积累,这是一个奇妙的过程。而通过选择性清除分析揭示这个过程中物种经历的变化是科学家们感兴趣的科学问题。




最后编辑:
作者:萌小白
一个热爱网络的青年!

发布评论

表情