转录本表达定量通常都是通过read比对来做,也有通过kmer做的。可以利用raw counts of mapped read 进行评估,但是这个指标没有考虑基因的长度和其他的因素。RPKM是一个去除了基因长度和文库影响的组内标准化的指标,同样的指标还有FPKM,RPKs,TPM等。主要的软件:Cufflinks,RSEM (RNA-Seq by Expectation Maximization) , eXpress , Sailfish and kallisto 。
一般情况下FPKM可以直接用于下游数据分析,但是如果存在较大的batch effect 建议标准化(log)缩小下,看看效果。
推荐阅读生信人文章:
转录组研究综述:https://www.shengxin.ren/article/13
batch effect:https://www.shengxin.ren/article/14