GEO数据做生存分析

小编今日又一次以小白的身份完成了从下载GEO数据到批量运行生存分析。

大家好,针对目前大家在社区上提的问题。小编今日又一次以小白的身份完成了从下载GEO数据到批量运行生存分析。

过程中踩了很多坑,这里先向团队的码农,扔两箱炸弹。

然后小编带着大家走一遍生存分析。

一、数据下载


打开GEO,选择GSE17538 数据,然后下载MINiML。

attachments-2017-10-XQB9D2XZ59ef414134310.png

二、格式转化

然后导入GEO_Convert.exe 工具。

attachments-2017-10-neBxRK4859ef41d6b6b50.png

导出样本信息数据和数据矩阵。

三、格式修改(可以防止踩大坑)

利用excel打开样本信息文本。

attachments-2017-10-wgxHCqQZ59ef426fe05b4.png
坑1:建议将将要用到的时间列和状态列名字改短。否则在工具中打不开。overall_event、overall survival follow-up time。

坑2:GEO的数据中一般是利用0代表 生存,1代表死亡。但是有些数据不是这样的,所以这里需要对death和no death 进行替换。否则会报错。

坑3:最大的坑就是某些特殊符号。这个时间列和状态列存在特殊符号比如;、,等。这些都是特殊符号需要替换掉。建议如果没有多次随访信息,直接替换掉全部特殊字符。

最后处理之后的表格:

attachments-2017-10-ZJE5Ureu59ef441b72cf8.png然后保存,进入最后的生存分析部分。

四、生存分析

打开生信人小工具生存分析

导入表达数据和样本信息。

选择数据来源为GEO(默认也是GEO,请忽略截图)

然后选择状态列为stat列(0,1)

时间列选择为os-time(主要选择时间单位年、月、日)

然后点击导出结果。

attachments-2017-10-2fKZZrUY59ef44604af48.png

然后导出表格如下,看到是不是很亲切,是的,这个表格可以放在文章里的。然后细心的童鞋会

发现这里已经按照P值进行过排序了(拿走,不写)。

attachments-2017-10-kMf9cYFr59ef450f49252.png

另外软件中可以交互的看每个基因生存分析的关系。

这个图同样可以导出矢量图,可以自主调整颜色放在文章里的。

attachments-2017-10-rysfYj2a59ef45af0fd25.png

  • 发表于 2017-10-24 21:53
  • 阅读 ( 20218 )
  • 分类:软件工具

7 条评论

请先 登录 后评论
不写代码的码农
张海伦

生物信息分析员

31 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章