如何利用TCGA的miRNA profiling中的read_count求RPKM?

最近刚开始研究TCGA的数据,想做一些分析工作。

利用TCGA下载工具V9下载了几个癌症的miRNA数据(BCGSC miRNA profiling),下载之后,看到了里面的read_count和reads_per_million_miRNA_mapped的值。

我想利用read_count求出RPKM,于是我学习了一下公式,RPKM= total exon reads/ (mapped reads (Millions) * exon length(KB)),发现分母上还要除以exon length。请问这个值要去哪里找?

如果做分析工作的话,是不是利用数据里提供的RPM就可以了?这两个数值对于分析来说,有什么影响吗?

谢谢。

请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

exon length需要你去下载对应基因组版本的gtf文件可以获得

RPM可以用,至于影响的话各有优势,结果都认的

请先 登录 后评论