exon length需要你去下载对应基因组版本的gtf文件可以获得
RPM可以用,至于影响的话各有优势,结果都认的
最近刚开始研究TCGA的数据,想做一些分析工作。
利用TCGA下载工具V9下载了几个癌症的miRNA数据(BCGSC miRNA profiling),下载之后,看到了里面的read_count和reads_per_million_miRNA_mapped的值。
我想利用read_count求出RPKM,于是我学习了一下公式,RPKM= total exon reads/ (mapped reads (Millions) * exon length(KB)),发现分母上还要除以exon length。请问这个值要去哪里找?
如果做分析工作的话,是不是利用数据里提供的RPM就可以了?这两个数值对于分析来说,有什么影响吗?
谢谢。