老师,您好,tcga lihc id转换开始分析用的是旧版的,得到24000左右的基因然后分析投稿被修回;试用新版的取蛋白编码基因只得到19000多。旧版的可以使用吗?差了几千个基因差别是在哪里呢?

请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

旧版使用的是biomart进行ID转换,得到编码基因共包含24000个(其中有一部分也是非编码的),而新版的使用的是gencode v22版本的gtf,根据里面的type=protein_coding进行提取的编码基因,其中不同的版本会相差一些基因的。

请先 登录 后评论