零代码系列之三教你如何做WGCNA数据准备

上一节课我们已经通篇解析待复现文章的整体思路,那么接下来开始我们正题数据预处理,1、GEO数据下载;2、数据选择已经多种标准化处理方法;3、缺失值补全;4、箱线图绘制;5、临床特征样本信息准备。那么下一节就是我们的重头戏,怎么使用一键式WGCNA已经模块筛选。

上一节课我们已经通篇解析待复现文章的整体思路,那么接下来开始我们正题

1、数据下载及处理

这里再前面的课程中已经灰常详细的讲解过GEO数据库种数据类型的介绍,见 用GEO数据不做实验不用编程轻松发两三分的文章    

这个也是一个老生常谈的问题,相比大家都已经接触很多,现在GEO的数据可以复制链接地址然后输入到IDM软件下载,这样也可以避免出现文件下载不完整的问题,社区里面已经有太多的小伙伴再使用GEO便捷转换器时候遇到过相同问题,这里大家也要注意老师的一些小细节。

attachments-2018-12-sFOF9SPN5c0e0fe28cf20.png

2、GEO转换器工具的使用过程,以及处理后的数据格式。

attachments-2018-12-HPMWBKnk5c0e10ba235e4.pngattachments-2018-12-EwAyGOP55c0e10bd59697.png

3、转换过程中ID的选择技巧和数据标准化是否标准化,标准化的方法

attachments-2018-12-AJFHYG1N5c0e10f896c29.pngattachments-2018-12-zGmH6uB55c0e112c6d9a3.png

4、那如果我下载是原始cell文件,我要从头开始处理,请问我要怎么办呢?别急sangerbox中已经为大家考虑到这一点,RMA即是为大家定制的相关软件。这里大家要记住我们该去哪里找对应平台的cdf文件,标准化过程中的一些小店

attachments-2018-12-kNjKhg3s5c0e11c02cc3c.pngattachments-2018-12-f7eiEZal5c0e11ae5f89e.png

5、数据标准化已经处理完毕,那有点同学又提出问题,我的数据里面又缺失值怎么办呀,这个更加esay,KNN小工具帮你解决。

attachments-2018-12-sr1wzFvW5c0e12afa6520.png

6、标准化也完事了,缺失值也补齐了,但是处理后的数据效果怎么样呢,通过boxplot箱线图小工具校验一下吧

attachments-2018-12-CePGYWIL5c0e132b6ab79.png

7、终于到最后一步了,临床样本数据的准备,请见讲解老师是如何一步一步通过excel实现的吧。attachments-2018-12-fSq5RUrl5c0e137f534b0.png


数据作为我们分析开始,对于后续结果的影响是不容小觑的这里我们通过这么复杂的处理过程希望后面对大家能有所帮助,那么下一节就是我们的重头戏,怎么使用一键式WGCNA已经模块筛选。

#163

  • 发表于 2018-12-10 15:24
  • 阅读 ( 1566 )
  • 分类:软件工具

5 条评论

请先 登录 后评论
不写代码的码农
调研图

37 篇文章

作家榜 »

  1. 合肥国肽生物 107 文章
  2. 祝让飞 104 文章
  3. 刘永鑫 64 文章
  4. SXR 44 文章
  5. 调研图 37 文章
  6. 生信分析流 34 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章