1) RPM转TPM: 可以先将RPM转为FPKM,参考 https://zhuanlan.zhihu.com/p/150300801 写个小程序就能解决; 2) 基因的length可用 R 包:biomaRt .
回答于 2021-03-09 14:08
TCGA和GEO数据之间存在平台差异,或者本质定量方式不同(RNAseq基于count,芯片基于荧光值);若在GEO验证归一化是必须的;个人建议最好对TCGA同一数据进行分组验证,GEO验证可以针对筛选出的基因进行表达水平的验证。另外ICGC也有一些数据可以纳入进行验证。具体可邮箱联系。
回答于 2021-01-08 13:37