富集分析工具汇总

富集分析文章解读

一篇介绍富集分析的文章,分享给大家,希望大家能够有所收获。

文章名字:SURVEY AND SUMMARY

Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists


一、摘要


曾经的基因的功能研究,往往都是一两个基因,这样研究较为简单。随着测序技术的发展,各种组学的突飞猛进,目前功能基因的研究数量较多。大量功能基因的研究成为挑战,很多的富集分析的软件被开发出来大概可以分为三类,大约一共有68个生信富集分析的工具。由于工具较多,对于研究者来说对理解每个软件的算法和优缺点比较困难,因此书写这篇文章目的在于帮助研究者能够根据自己的问题选择最为合适的生信富集分析工具。


二、背景介绍

 biocc_2d7d347d_7a19_4e73_af97_634631c316

biocc_a814f01a_9eb0_4abf_b768_d5f239cde1


高通量测序时代,使得对全基因组范围内的基因进行整体研究分析成为可能,这样会产生大量的感兴趣的基因。从感兴趣的基因组筛选有意义的基因也成为一件挑战和令人沮丧的事情。好在GO数据库和其他一些富集分析的软件出现,02年到03年间DAVIDEASE等软件出现、0514个类似的软件出现,到现在大约一共有68个富集分析的软件。

目前对于研究者而言因为富集分析没有统一的方法、也没有黄金标准,因此存在以下几点问题。

  1. 对已有的工具选择越来越难。

  2. 理解和比较各个软件的算法越来越难。

  3. 由于软件太对,好的软件和算法容易被忽略。

  4. 容易导致重复性工作。

  5. 找到最为合适的工具太难。


三、公开的富集分析的工具

 biocc_39ee8b5e_44dc_4c03_a72f_721454c95d

  1. 富集分析主要包括三部分:数据注释、数据挖掘和结果展示。对于传统的富集分析主要依赖于经典的统计学分析方法,例如卡方检验、Fisher检验、二项检验、超几何检验等。根据其内在的算法主要可以分为三类:奇异富集分析(SEA)、基因集富集分析(GSEA)、模块化富集分析(MEA)等。

 biocc_cdfd1761_17fc_4169_b3e4_8a7a21560b
其中SEA主要特点在于需要用户提前制定感兴趣的基因集,DAVIDGoStat等。

GSEA不需要提前制定感兴趣的基因集,主要是用于转录组数据,根据实验组和对照组计算差异来得到刚兴趣的基因,主要的的代表软件GSEAGapMap等。

MEA核心仍然是SEA的原理,但是其会将基因和基因的关系考虑进入富集分析p值的计算。

 

四、目前仍然存在的问题和挑战


1. Realistically positioning the role of enrichment P-values in he current data-mining environment

2. Understanding the limitation of multiple testing correction on enrichment P-values

3. Cross-comparing enrichment analysis results derived from multiple gene lists

4.Setting up the ‘right’ gene reference background

5.Extending backend annotation databases

6.Efficiently mapping users’ input gene identifiers to the available annotation

7.Enhancing the exploratory capability and graphical Presentation

8.Evaluating the analytic capability of new enrichment tools

9.Choosing the most appropriate enrichment tools from the various choices

  • 发表于 2017-03-30 21:52
  • 阅读 ( 5769 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
不写代码的码农
SXR

44 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章