10 关于ENSG_ID转换成基因名称的问题。


我是用"TCGAbiolinks"这个包在TCGA数据下载的RNA-Seq数据,类型是HTSeq - FPKM,代码如下:

projectid<-"TCGA-UVM"

query.count<-GDCquery(project = projectid,data.category = "Transcriptome Profiling",data.type="Gene Expression Quantification",workflow.type="HTSeq - FPKM") GDCdownload(query.count) dataAssay=GDCprepare(query.count,summarizedExperiment = F)

想问一下下载后的ENSG_ID为啥后面是小数,而数据库里的ENSG_ID是整数呢?这是因为用了R包的原因吗?去掉的话会不会影响匹配的准确性呢?

请先 登录 后评论

2 个回答

祝让飞 - 生物信息工程师

可以直接去掉,不会影响匹配,小数表示的是这个ID的版本号,整数才是ID

请先 登录 后评论
胡一凡 - 学生

可是去掉后 我的有重复的 转出来是两个相同的基因名 表达量却不相同

请先 登录 后评论
  • 2 关注
  • 0 收藏,6495 浏览
  • Amengx 提出于 2019-04-16 23:16