看教程不够直观,那就看视频吧! >>点击加载视频
GEO数据库中主要是四种文件格式,包括RAW.tar、Series Matrix File、MINiML formmatted family file和SOFT formmatted family file四种形式,如下图
其中RAW.tar是原始未经过任何处理数据、Series Matrix File是已经标准化好的矩阵文件,GEO便捷转换器主要处理MINiML formmatted family file文件。
首先,打开GEO便捷转换器,会弹出如下一个界面
接下来,选择文件,这里选择之前下载好的文件,如果已经解压出来需要导入.xml文件
导入工具中,如下图所示
1:输入MINiML formmatted family file;
2:MINiML formmatted family file数据部分展示;
3:选择基因命名类型,通常选择symbol;
4:数据转换类型,选择normalized;
5:多个探针对应同一基因时处理方法,这个根据数据要求进行选择,通常中位数;
6:数据集里面包含的一些临床等信息;
7:表达矩阵数据。
按照上述参数设定好后,点击导出样本信息和数据矩阵,在输入数据的目录下面会生成一个文件夹如
点击进入后会出现很多文件,找到MergeExpro_*.txt开头的文件就OK了,这个就是我们提取好的表达矩阵数据,同样还有一个SampleInfo_*.txt即是对应的样本信息文件。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!