简易数据标准化工具使用说明

简易数据标准化工具

    在数据分析之前,通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化是将数据按照比例缩放,使之落入一个小的特定区间,数据标准化的方法有很多种,常用的有Z-score、分位数等。

  1. 首先打开工具界面进行介绍

attachments-2018-07-tq0drSJS5b47067760094.png

1和2是选择输入数据的两种方式,1为导入单个表达矩阵,2可以同时导入多个矩阵(操作方法就是按住Ctrl即可)

3是四种标准化方法

TPM:适用于TCGA数据库;TPM的计算方法:

    1)标准化基因长度:将所有基因的Read数除以基因长度(基因长度单位为kb);

    2)计算总Read数:计算每一个样本的总Read数,然后将其换算为以百万位单位(M)

    3)标准化总Read数:将所有基因的Read数除以总Read数;

Z-score:是基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化;

log2(x+1):log函数标准化很简单就不多说了

quantiles步骤:

    1)对每张芯片的数据点排序;

    2)求出同一位置的几次重复实验数据的均值,并用该均值代替该位置的基因的表达量;

    3)将每个基因还原到本身的位置上。

那么最后就是操作起来更为简单,直接点击转换并导出,选择要出输出的目录,等待完成就好

最终生成结果为Meger*.txt的一个文件


attachments-2018-07-TvcaPcKM5b471a7652367.png





  • 发表于 2018-07-12 17:08
  • 阅读 ( 13097 )
  • 分类:软件工具

4 条评论

请先 登录 后评论
不写代码的码农
调研图

38 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章