关于TCGA数据filtration的问题

1、下载raw counts或者FPKM数据,有一些表达很低的基因需要过滤掉,一般有哪些常见的过滤标准呢?EdgeR有没有自带的过滤数据函数?

2、在计算基因表达相关系数和做散点图和拟合直线的时候,数值为0的需要特别处理吗?

请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

1、一般我们会将FPKM<1的认为不表达过滤掉,看这样数目多大,大于20%也可以直接过滤掉

2、这个看这个基因在这些样本中0的数目占比多大,一般我们会去掉0很多的,比如 一半以上

请先 登录 后评论