可是去掉后 我的有重复的 转出来是两个相同的基因名 表达量却不相同
我是用"TCGAbiolinks"这个包在TCGA数据下载的RNA-Seq数据,类型是HTSeq - FPKM,代码如下:
projectid<-"TCGA-UVM"
query.count<-GDCquery(project = projectid,data.category = "Transcriptome Profiling",data.type="Gene Expression Quantification",workflow.type="HTSeq - FPKM") GDCdownload(query.count) dataAssay=GDCprepare(query.count,summarizedExperiment = F)
想问一下下载后的ENSG_ID为啥后面是小数,而数据库里的ENSG_ID是整数呢?这是因为用了R包的原因吗?去掉的话会不会影响匹配的准确性呢?