如何极其简单的使用GEO数据来做差异分析

无论你是要看某个基因是否差异表达或者筛选某个GEO数据集的差异基因,这个方法绝对能够帮助你事半功倍 首先假设你已经找到了一套数据GSE32323 这套数据共包含44个样本,其中有17个配对的癌与...

新版本DECenter使用看这里:https://www.shengxin.ren/article/207

无论你是要看某个基因是否差异表达或者筛选某个GEO数据集的差异基因,这个方法绝对能够帮助你事半功倍

首先假设你已经找到了一套数据GSE32323

这套数据共包含44个样本,其中有17个配对的癌与癌旁样本

我们先下载数据,如图

attachments-2017-09-ZTZSh4i859cc58dd09fc然后使用GEO芯片数据转换器提取出表达矩阵和样本信息表 (不会提看这里)如图:

attachments-2017-09-zCbj7uLc59cc5f26ed40

打开SampleInfo.xls文件编辑样本顺序和分组

attachments-2017-09-SyIbDemZ59cc5ff96c43最终修改后的样本信息表为(为什么cancer排在前面?软件默认前面比后面啊):

attachments-2017-09-IYp1xYyU59cc628df1db

然后使用DECenter(下载链接:http://gap.shengxin.ren/tool/10/)进行差异分析

打开,长这个样子

attachments-2017-10-JPfq2YOY59dd86944638

看似需填项比较多,其实无非就四步

1、选择表达矩阵

2、选择样本信息表(因为你要告诉软件怎么分组的嘛)

3、选择筛选差异的方法,如果是芯片数据当然选择limma了,如果是RNA-Seq的counts数据,选择DESeq2或者edgR也行啊

4、选择样本分组列,然后选择结果保存目录点击运行就行了

示例如下:

attachments-2017-10-099Dx4tW59dd87eae19d等提示跑完,打开结果保存的目录

attachments-2017-10-ec7WLV7q59dd881b9e38总共得到三个文件

1、cancer-vs-normal.limma.txt:这是cancer比normal的所有基因差异结果

2、cancer-vs-normal.limma_Dif.txt:这是根据咱们在软件选择的阈值筛选之后的差异结果

3、cancer-vs-normal.limma_TopExp.txt:这是提取的最差异的基因的表达谱

得到了差异结果之后,我们要对结果进行一个展示吧

先拿cancer-vs-normal.limma.txt使用火山图制作工具做个火山图,教程看这里:https://www.shengxin.ren/article/174

attachments-2017-10-NVzV2HCE59dd898c6a2d再拿cancer-vs-normal.limma_TopExp.txt使用热图绘制工具画个热图:教程看这里:https://www.shengxin.ren/article/165

attachments-2017-10-qSLDDjGn59dd8ab86a03导出图片,放到PPT中就可以向老板汇报了


  • 发表于 2017-09-28 10:48
  • 阅读 ( 21853 )
  • 分类:软件工具

38 条评论

请先 登录 后评论
不写代码的码农
祝让飞

生物信息工程师

104 篇文章

作家榜 »

  1. 合肥国肽生物 107 文章
  2. 祝让飞 104 文章
  3. 刘永鑫 64 文章
  4. SXR 44 文章
  5. 调研图 37 文章
  6. 生信分析流 34 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章