可以直接去掉,不会影响匹配,小数表示的是这个ID的版本号,整数才是ID
我是用"TCGAbiolinks"这个包在TCGA数据下载的RNA-Seq数据,类型是HTSeq - FPKM,代码如下:
projectid<-"TCGA-UVM"
query.count<-GDCquery(project = projectid,data.category = "Transcriptome Profiling",data.type="Gene Expression Quantification",workflow.type="HTSeq - FPKM") GDCdownload(query.count) dataAssay=GDCprepare(query.count,summarizedExperiment = F)
想问一下下载后的ENSG_ID为啥后面是小数,而数据库里的ENSG_ID是整数呢?这是因为用了R包的原因吗?去掉的话会不会影响匹配的准确性呢?