5 sangerbox转化的TPM,表达值之间感觉差距很大,可以直接用于差异分析和heatmap.2热图绘制吗

新手小白,用sangerbox下载了TCGA的转录组数据,下载的格式是FPKM

之后用 “简易数据标准化工具”,将FPKM转换成TPM

但是TPM中的表达量参差不齐,从0到几万都有

请问这样算是标准化完了吗?因为看一些视频里,标准化之后的数据好像都差别不大。

用这样的数据进行差异分析绘制热图以后效果很差,我怀疑是标准化这一步出现了问题。

如果是标准化的问题,请问各位应该如何处理。

【图一】按升序排的表达量,【图二】按降序排的表达量,从图1图2可以看出表达量数量级差别很大。【图三】绘制的热图attachments-2019-04-njf8KC985ca41871c2c0e.pngattachments-2019-04-KGp9RZW65ca4187c4222c.pngattachments-2019-04-9BR8YMC05ca4188b0958d.png

请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

这是正常的,那些差异较大的 是因为本身表达丰度不高,在做数据清洗时 一般会被过滤掉

请先 登录 后评论
  • 1 关注
  • 0 收藏,6443 浏览
  • 吕晓敏 提出于 2019-04-03 22:22

相似问题