祝老师,您好?如何识别GEO数据库下载文件是什么类型?

GEO数据库geo81089的Supplementary file有两个文件,一个的文件名是GSE81089_FPKM_cufflinks.tsv.gz,另一个是GSE81089_readcounts_featurecounts.tsv.gz。这两者哪个是原始counts数据,哪个是已经标准化(归一化)的数据?如果从文件名来看,含有FPKM关键词的文件应该是已经进行了FPKM处理了吧,也就是说已经标准化了?另一个问题:如果说FPKM是一种标准化处理办法,为什么生信人论坛里还要提FPKM转换成TPM呢(https://shengxin.ren/article/150)?TPM也是一种和FPKM并列的标准化办法呀!?

请先 登录 后评论

2 个回答

祝让飞 - 生物信息工程师

首先FPKM_cufflinks文件表示使用cufflinks这个软件计算好的FPKM,可以直接使用。

readcounts_featurecounts这个文件是原始的Counts数据。

FPKM转换成TPM 这个看个人习惯,两个都能用的

请先 登录 后评论
卢某某

TPM可以用于不同read之间比较(因为之前已经相对自己的片段长度矫正了一次了,可以理解为这样计算得到了片段的表达量)

但是RPKM/FPKM不可以

还要再经过进一步的校正

请先 登录 后评论