2021-03-09 14:13 回答问题
进行数据分箱,常用的包有 infotheo,discretization;可以照着示例数据操作一下。
2021-03-09 14:08 回答问题
1) RPM转TPM: 可以先将RPM转为FPKM,参考 https://zhuanlan.zhihu.com/p/150300801 写个小程序就能解决; 2) 基因的length可用 R 包:biomaRt .
2021-01-08 13:40 回答问题
合并不合并,主要看分析目的。个人建议是单独分析,最好取交集。
2021-01-08 13:39 回答问题
问题描述如果能更详细一些就好了。
2021-01-08 13:37 回答问题
TCGA和GEO数据之间存在平台差异,或者本质定量方式不同(RNAseq基于count,芯片基于荧光值);若在GEO验证归一化是必须的;个人建议最好对TCGA同一数据进行分组验证,GEO验证可以针对筛选出的基因进行表达水平的验证。另外ICGC也有一些数据可以纳入进行验证。具体可邮箱联系。