一般认为,癌症是一类基因疾病。基因对细胞生长的调控就像开车,有两大类基因进行调控,分别是“加油基因”和“刹车基因”。“加油基因”负责保持生长速度,让身体的细胞不断得到更新;“刹车基因”负责减缓或者终止细胞生长,以供新生细胞代替原来功能。某些“加油基因”或者“刹车基因”突变后就会对癌症的发生和发展过程起到推动作用且影响显著,这类基因就是肿瘤驱动基因(driver gene),而不会直接导致癌症发展的基因叫做乘客基因(passenger gene)。比如EGFR基因变异在肺腺癌等多种癌症中可导致细胞功能异常并引起癌变,而且根据驱动基因还可以把肺癌进行重新分类。遗传性的BRAC1基因突变则会导致乳腺癌的发生。驱动基因突变可赋予肿瘤细胞选择优势,如提高细胞分裂能力、使细胞逃避调亡、逃避生长负调控机制等。
关于肿瘤驱动基因/突变的信息,有多个网站上可以查询,比如NCG网站(http://ncg.kcl.ac.uk/index.php),该网站收录了711个已经验证过的肿瘤驱动基因,1661个候选的驱动基因。网站截图如下:
其他比如OncoKB癌症基因list数据库(https://www.oncokb.org/cancerGenes),含1064个驱动基因;intogen数据库(https://www.intogen.org/search),含有66种癌症,568个driver突变。这些网站均有不定期的更新。具体的操作这里不再展开,感兴趣读者可自行打开并搜索。
如果想要发现一些全新的驱动基因(或者叫Significantly mutated genes,SMGs),又该怎么做呢?我们可以基于生物信息预测的方法进行分析或者预测,一般驱动基因的鉴定是通过高通量测序技术、芯片技术以及结合一些生物信息学算法进行鉴定。常用的算法有三种。
01
基于频率的算法
基于癌症驱动基因比其他基因的突变频率较高这一原理,使用统计算法计算出高频突变频率高于背景突变频率的基因为癌症驱动基因,代表性软件为MutSigCV。百度李彦宏参与的食管鳞状细胞癌中新发现的22个候选驱动基因即是采用MutSigCV和OncodriveFML两种方法进行的鉴定(Cui et al., 2020)。
02
基于突变聚类的方法
通过检测基因间显着聚集在氨基酸序列特定区域的突变的基因,代表性软件为OncodriveCLUST。
03
基于基因功能的算法
根据突变基因对应的蛋白信息构建基因突变有害性的评价模型,最终将有害性较高的基因认定为驱动基因,代表性软件为OncodriveFM。
其他有基于网络和pathway的方法(Network or pathway based),基于网络和通路分析的算法可以对肿瘤中突变产生的突变效应有一个很好的评估,软件有PARADIGM等。基于整合多种组学数据的方法(Data integration based),整合体细胞突变、结构变异、基因表达、甲基化谱来构建网络分析方法是一个重要的研究方向,软件有Helios等。经验上来说,在利用生物信息学鉴定肿瘤驱动基因时,不同的软件可以互相发现一些其他检测方法忽略的基因,因此在检测肿瘤的驱动基因时建议使用基于不同原理的软件综合检测。
参考文献
Cui Y, Chen H, Xi R, et al. Whole-genome sequencing of 508 patients identifies key molecular features associated with poor prognosis in esophageal squamous cell carcinoma[J]. Cell Research, 2020: 1-12.- 本文固定链接: https://maimengkong.com/kyjc/1486.html
- 转载请注明: : 萌小白 2023年4月28日 于 卖萌控的博客 发表
- 百度已收录