小白做差异分析

如何利用生信人工具把坑踩完,完成筛选差异。

今天跟大家分享下小编使用GEO转化工具,DEC差异筛选工具,火山图工具,热图工具的试用经过。

(PS之前重来木有做过差异分析的我,完全利用小工具实现~~~)

视频版下载:https://pan.baidu.com/s/1i5tKlnv

昨天有一个学姐让我分析下GSE79737这套数据。

一、数据下载

首先打开GEO网站,搜索GSE79737,点击GPL16570 参考数据信息。

 

attachments-2017-10-Ta6KWA7R59e08187c45b3.png

可以知道,样本的第一列是探针信息,gene_assignment是比对上的基因id,不过比对上的id有很多种,这里需要用后面简单处理下。

 

attachments-2017-10-Pi1Hmqn859e0819850c70.png

 

按照教程下载

attachments-2017-10-E9igJUQz59e081a67780a.png二、格式转换

然后打开生信人GEO_Convert.exe工具。

 

attachments-2017-10-rHM07tzC59e081cde5e34.png

点击选择文件读入GSE79737_family.xml.tgz

 

attachments-2017-10-HrwsixEH59e081dd4c865.png

注意此处选择的时候,要看数据列是第二列(一般都是),然后看他其实是已经取过log了。

然后ID处要注意,选择刚才看到的gene_assignment列。

 

attachments-2017-10-TLsDkoBj59e081ec3d519.png

然后点击导出样本信息,导出数据矩阵。

 

attachments-2017-10-Z2AVDwPR59e081fb1168c.png

 

三、筛选差异

然后打开DECenter筛选差异。

并将刚才导出的数据矩阵,样本信息和输出目录选择好。

 

attachments-2017-10-t5n3iWuX59e0820c93ff3.png

点击样本信息按钮,查看信息

 

attachments-2017-10-RInvmGns59e0821b90d34.png

看是配对样本。可以选择limma进行分析。(由于我这个数据质量不是很好,所以这里我选择P<1),abs(log2FC))>1

然后样本类型列选择treatment,运行导出。

如果结果不好,可以反复的调整plfc进行结果优化。

 

attachments-2017-10-Er4sZ8Pt59e08229b0205.png

结果会有三个文件,第一个limma.txt格式如下

 

attachments-2017-10-RnfDPWrb59e082357d96c.png

第一列是基因id,第二列是log2(FC),第三列是表达值,第四列是t值,第五列是p值,第六列是调整之后的p值(fdr),第七列是B值。这个文件可以用于后面绘制火山图。

其中第一列、第二列,第六列是比较重要的指标。

然后看筛选出来的差异基因。也就是Diff.txt.

 

attachments-2017-10-neA9VQst59e08241c6a2f.png

重要的信息是第二列,第六列和最后一列。

然后看下TopExp.txt。这些是差异基因在各个样本中的表达情况,可以用于后面绘制热图。

 

attachments-2017-10-v8LSvj2K59e0824ca9e03.png

 

四、绘制火山图

打开生信人绘制火山图工具,选择PBS;-vs-MG;.limma.txt文件(因为我这个显著的不多,所以用全部的来绘制。)

然后通过调整点的大小调整图片,还是可以看到零星的几个点。

 

attachments-2017-10-MX2eZIAt59e08259576aa.png

 

五、绘制热图

绘制热图之前,打开topExp这个文件,修改id

 

attachments-2017-10-eoxpLLBL59e0826613cf8.png

选中第一列,将其复制到第二个表格或者空白处。

 

attachments-2017-10-y8PliWVq59e08272042da.png

选择对其进行分列,由于id之间是通过//分割,所以分列是选择/来分割,然后将gene_symble列复制到原图表中。

 

attachments-2017-10-Nz4iqr7p59e0827ed405e.png

结果如下

 

attachments-2017-10-YYBxUZdc59e0828bcdac9.png

打开聚类热图绘制工具,导入刚才处理完的表格。

 

attachments-2017-10-ToMoagtk59e0829700786.png

然后选中RowZ-score,默认欧式聚类进行聚类。

 

attachments-2017-10-PiZmPgoV59e082a2c800e.png

导出图片就ok了。

 

 

 

 

 

 

 


  • 发表于 2017-10-13 17:10
  • 阅读 ( 11440 )
  • 分类:软件工具

7 条评论

请先 登录 后评论
不写代码的码农
张海伦

生物信息分析员

31 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章