缺失值补全和数据标准化工具

在数据分析过程中必然会面临两种问题,一种数据 数据存在缺失,一种是数据没有标准化,在这里我们提供了 一个简易的一体化的工具用于处理数据缺失补全和数据标准化。 界面如下: 工具界面非常...

在数据分析过程中必然会面临两种问题,一种数据 数据存在缺失,一种是数据没有标准化,在这里我们提供了 一个简易的一体化的工具用于处理数据缺失补全和数据标准化。

界面如下:

attachments-2021-07-mb9KMqXx60f8d91b2a580.png工具界面非常简单,结果和非常简单,如下:

attachments-2021-07-9AeJvjkK60f8d9672e435.png


当然最重要的是怎么写这个结果,标准模板如下:

缺失值补全写作:

首先我们获取了表达矩阵,去除了NA值比例大于X%的行(基因)和NA值比例大于Y%的列(样本),更进一步的利用R软件包impute的impute.knn函数进行缺失值补全,设置Number of neighbors 为 K以补全数据缺失。

数据标准化部分写作:

更进一步的我们对数据进行了【分位数标准化、中位数标准化、log2转换,行Z-score转换,列Z-score转换,行和列Z-score转换


  • 发表于 2021-07-22 10:45
  • 阅读 ( 2350 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
不写代码的码农
admin

57 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章