GEO便捷转换器使用教程,帮你轻松处理GEO平台数据

GEO便捷转换器使用教程,帮你轻松处理GEO平台数据

GEO数据库中主要是四种文件格式,包括RAW.tar、Series Matrix File、MINiML formmatted family file和SOFT formmatted family file四种形式,如下图

attachments-2018-07-opSZXB4v5b46c963be75f.png

其中RAW.tar是原始未经过任何处理数据、Series Matrix File是已经标准化好的矩阵文件,GEO便捷转换器主要处理MINiML formmatted family file文件。

首先,打开GEO便捷转换器,会弹出如下一个界面

attachments-2018-07-HJx5SDUQ5b46cb32da7df.png

接下来,选择文件,这里选择之前下载好的文件,如果已经解压出来需要导入.xml文件

attachments-2018-07-froUDFso5b46eb063f530.png

导入工具中,如下图所示

attachments-2018-07-DvVRVMWQ5b46ebcc986c6.png

1:输入MINiML formmatted family file;

2:MINiML formmatted family file数据部分展示;

3:选择基因命名类型,通常选择symbol;

attachments-2018-07-Scf3Y29h5b46ec97ac385.png

4:数据转换类型,选择normalized;

attachments-2018-07-TXzL1ifM5b46ecbd9b5a4.png

5:多个探针对应同一基因时处理方法,这个根据数据要求进行选择,通常中位数;

attachments-2018-07-2VubvV145b46ed35387d3.png

6:数据集里面包含的一些临床等信息;

7:表达矩阵数据。

按照上述参数设定好后,点击导出样本信息和数据矩阵,在输入数据的目录下面会生成一个文件夹如

attachments-2018-07-mP6DAHuJ5b46ee7f635f7.png点击进入后会出现很多文件,找到MergeExpro_*.txt开头的文件就OK了,这个就是我们提取好的表达矩阵数据,同样还有一个SampleInfo_*.txt即是对应的样本信息文件。




attachments-2018-07-fPnakaHH5b46f0d583fd0.png






  • 发表于 2018-07-12 14:08
  • 阅读 ( 31368 )
  • 分类:软件工具

51 条评论

请先 登录 后评论
不写代码的码农
调研图

38 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章