关于ENSG_ID转换成基因名称的问题。

10 关于ENSG_ID转换成基因名称的问题。

我是用"TCGAbiolinks"这个包在TCGA数据下载的RNA-Seq数据，类型是HTSeq - FPKM，代码如下：

projectid<-"TCGA-UVM"

query.count<-GDCquery(project = projectid,data.category = "Transcriptome Profiling",data.type="Gene Expression Quantification",workflow.type="HTSeq - FPKM") GDCdownload(query.count) dataAssay=GDCprepare(query.count,summarizedExperiment = F)

想问一下下载后的ENSG_ID为啥后面是小数，而数据库里的ENSG_ID是整数呢？这是因为用了R包的原因吗？去掉的话会不会影响匹配的准确性呢？

0 条评论

默认排序时间排序

2 个回答

祝让飞 - 生物信息工程师 2019-04-22 20:17

可以直接去掉，不会影响匹配，小数表示的是这个ID的版本号，整数才是ID

胡一凡 - 学生 2020-12-24 12:38

可是去掉后我的有重复的转出来是两个相同的基因名表达量却不相同

10 关于ENSG_ID转换成基因名称的问题。

2 个回答

相似问题