简单的理解:
1、FPKM 是原始的
2、FPKM-UQ 是使用上四分位数(75%)来对数据做标准化
也就是FPKM-UQ是做了矫正的,矫正方法如下:
每个基因的FPKM的计算是:
基因A的FPKM=比对到基因A上的reads数目*10^9/(基因长度*比对到所有基因的reads的总和)
那么FPKM-UQ的计算方式与FPKM的不同之处在于没有除以“比对到所有基因的reads的总和",请仔细看:
基因A的FPKM-UQ=比对到基因A上的reads数目*10^9/(基因长度*上四分位数处的基因的reads的数目)
重点理解:上四分位数处的基因的reads的数目
每个基因都有 比对到该基因上的reads数目,那么对这些基因对应的“比对到该基因上的reads数目”进行从小到大排序,选择第75%个基因对应的“比对到该基因上的reads数目”作为“上四分位数处的基因的reads的数目”
最后申明:你用哪个都行,FPKM-UQ相当于做了组间标准化