看教程不够直观,那就看视频吧! >>点击加载视频
官网 http://software.broadinstitute.org/gsea/index.jsp
官网下载 http://software.broadinstitute.org/gsea/downloads.jsp
安装前需要安装好java环境
官网说明书 http://software.broadinstitute.org/gsea/doc/desktop_tutorial.jsp
首先我们先了解一下什么叫做基因富集分析
基因富集分析是分析基因表达信息的一种方法,富集是指将基因按照先验知识,也就是基因组注释信息进行分类。
2005年提出了基于基因集(gene set)定义的基因富集分析方法。 首先要定义基因集,也就是基于我们的先验知识(基因组注释信息),将基因富集,可以想象成,用一堆代表基因功能的箱子(bin)把具有相同或相似功能的基因装起来,起到了降维的作用,当然,每个基因可能同时参与好几种功能。
这样,得到这两组数据后,我们所分析的不是单个基因表达的差异,而是箱子与箱子之间的差异。由此,我们得到的数据更容易解释。
GSEA基本思想
使用预定义的基因集,将基因按照在两类样本中的差异表达程序排序,检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。
GASEA原理
PNAS文章Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.Proc Natl Acad Sci U S A. 2005 Oct 25;102(43):15545-50. Epub 2005 Sep 30.
GSEA如何使用
我们只需要一个表达矩阵,并做出分组说明的cls文件
说明书的测试数据http://software.broadinstitute.org/gsea/datasets.jsp
数据要求格式:http://www.broadinstitute.org/cancer/software/gsea/wiki/index.php/Data_formats
我直接下载p53的测试数据
12625:基因数量 50 :样本数量
说明文件:50个样本分两组,一组为Death(D),一组为Alive(A)
50 2 1
#Death Alive
D D D D D D D D D D D D D D D D D D D D D D D D D A A A A A A A A A A A A A A A A A A A A A A A A A
(一共50个 各25个)
然后用Method 1将两个文件导入GSEA
确定无误后开始运行,运行需要设置参数
输出的数据非常多,对你选择的gene set数据集里面的每个set都会分析看看是否符合富集的标准,富集就出来一个报告。
点击success就能进入报告主页,里面的链接可以进入任意一个分报告。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!