说起代谢组数据分析软件,可能大家第一个想到的就是SIMCA-P。SIMCA-P (http://umetrics.com/products/simca)软件是由Umetrics公司在1987研究开发,目前是一款公认的多元变量统计分析软件,被绝大多数代谢组服务提供商所采用。SIMCA-P虽然是一款强大的多元变量统计分析软件,但也有不足之处:
-
SIMCA-P是一款商业软件,需要收费(但有30天免费试用),windows版本的。对于想使用免费软件的老师来说,不那么友好;
-
代谢组数据的分析除了多元变量统计分析,还有原始数据前处理(pre-processing)、数据处理(processing)、单变量统计分析等,很显然SIMCA-P并不能满足我的所有愿望……
那么,还有哪些代谢组数据分析软件,既免费又功能强大呢?
在《Metabolomics-Fundamentals and Applications》这本书的第四章节《Processing and Visualization of Metabolomics Data Using R》[1]中,作者列出了一些代谢组数据处理、统计分析与可视化的开源免费软件工具,如下表所示:
今天就给大家介绍4款开源的免费代谢组数据分析软件,这4款软件功能各异,大家按需采用哈。
1
XCMS
XCMS是2006年发布的、基于R语言的用于LC-MS数据处理分析的软件[2]。该软件是命令行驱动的,需要有R语言基础。XCMS主要用于LCMS raw files数据的pre-processing,包括保留时间校正、数据过滤、峰识别、峰提取等。另外,XCMS也可以整合其他的R包,如ggplot2、prcomp、heatmap2、muma等,进行多变量统计分析和画图、聚类分析、画个性化图形等。下面是用XCMS软件分析得到的结果图片:
TIC图:
差异代谢物盒型图:
OPLS-DA分析的S-plot:
XCMS的优点是自主性强,虽然基于网页的分析工具(下面将介绍)非常方便,但基于R语言的XCMS可以更加灵活,也可以画出更多个性化图片。
2
XCMS Online
XCMS Online(https://xcmsonline.scripps.edu)是XCMS的网页版本[3][4],不需要命令行环境,不懂R语言编程也可以自由使用~~目前已被广泛使用。
XCMS Online支持多种实验方案数据(Dependent (paired) two-group comparisons, meta-analysis, and multigroup comparisons)的分析,可进行单变量分析和PCA分析,结果包括TIC图等前处理图表、PCA、热图等。只需要简单的两步:上传原始MS数据、选择参数,结果就自动出来了,非常便捷(如下图):
值得注意的是,XCMS Online是由开发METLIN数据库的美国斯克里普斯研究院(Scripps Research Institute)开发,因此整合了METLIN数据库,物质定性无缝连接METLIN数据库,网页界面也与METLIN数据库非常相似。
另外,XCMS Online还可以进行pathway分析,整合蛋白数据和基因数据,大家可以自行试试。
3
MetaboAnalyst3.0
MetaboAnalyst是2009年公布的一款代谢物数据分析软件[5][6],也是一款非常受欢迎使用率很高的基于网页的软件工具,目前版本为3.0。MetaboAnalyst支持多种平台的数据(NMR, GC-MS, LC-MS),总共包括了八个功能模块,可以分为三类:统计分析模块、功能注释模块(代谢通路分析与富集分析)、高级分析模块(多组学关联分析、生物标记物分析、power analysis)。
区分于其他的代谢组数据分析软件,MetaboAnalyst最特别的是可以进行代谢通路分析与富集分析、生物标记物分析(ROC曲线)、临床研究的功效分析(power analysis)和样本量估算、与基因表达数据的代谢通路整合分析。因此个人感觉是功能最全最多的一款软件了。不过其貌似不能处理原始数据,只能对经过预处理(preprocessing)的数据进行分析。所以可以结合XCMS来使用,先用XCMS进行原始数据的预处理,再用MetaboAnalyst进行统计分析、代谢通路分析和其他高级分析。
4
OS-Tools差异代谢物分析工具
最后,隆重推荐omicshare云平台上的差异代谢物分析工具啦!(网址:www.omicshare.com/tools)该工具的目的是进行差异代谢物的筛选,采用了单变量统计T检验方法和多变量统计PLS-DA或OPLS-DA方法相结合的方法来筛选差异代谢物,得到的结果包括差异代谢物列表、PCA得分图、(O)PLS-DA得分图、permutation test图等。虽然不像上述所介绍的在线软件那样功能强大,但我们相信差异代谢物筛选是代谢组研究中的一个重要环节,做好了这一步,就事半功倍了!
所得结果展示:
PCA得分图:
OPLS-DA得分图:
permutation test验证图:
参考文献:
[1] Grace S C, Hudson D A. Processing and Visualization of Metabolomics Data Using R[M]//Metabolomics-Fundamentals and Applications. InTech, 2016.
[2] Smith CA, Want EJ, O'Maille G, Abagyan R, Siuzdak G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching and identification.Anal. Chem. 2006;78:779–787. DOI: 10.1021/ac051437y.
[3] Tautenhahn R, aĴiGJ, Rinehart D, Siuzdak G. XCMS Online: a web‐based platform to process untargeted metabolomic data. Anal. Chem. 2012;84:5035–5039. DOI: 10.1021/ac300698c
[4] Gowda H, Ivanisevic J, Johnson CH, Kurczy ME, Benton HP, Rinehart D, Siuzdak G. Interactive XCMS Online: simplifying advanced metabolomic data processing and subsequent statistical analyses. Anal. Chem. 2014;86(14):6931–6939. DOI: 10.1021/ac500734c.
[5] Xia J, Wishart DS. Web‐based inference of biological patterns, functions and pathways from metabolomic data using MetaboAnalyst. Nat. Protocol.2011;6:743–760. DOI: 10.1038/nprot.2011.319
[6] Xia J, Sinelnikov I, Han B, Wishart DS. MetaboAnalyst 3.0 ‐ making metabolomics more meaningful. Nucleic Acids Res. 2015;43:251–257. DOI: 10.1093/nar/gkv380- 本文固定链接: https://maimengkong.com/zu/1713.html
- 转载请注明: : 萌小白 2024年4月1日 于 卖萌控的博客 发表
- 百度已收录