楼上说的应该是没问题的,我也遇到过一些ENSG转换不了,而且这些转换不了的在NCBI里都查不到对应的gene,你可以试试。
ID转换出现了新的问题,就是我此前进行过ID转换,单独转换提取编码基因(mRNA),数量有变化,这个是其中一个疑问点。现在是19754个成功转换。以前也做过,跟这个不一样,不过大概也是这个范围1万9千多个;另外一个问题是,其中有一些仍然是ENSG号码,没有转换为Gene Symbol,不知道是为什么。我在genecard中根据ENSG号码可以查到相关的基因。另外,我把没有转换为Gene Symbol的ENSG提取出来,单独弄一个文件进行ID转换,仍然是同样的结果。下附图:
求解。
附:lncRNA中这种情况更多,只有少部分是非编码RNA名称。对非编码RNA关注很少,这个作为扩展问题吧。感谢老师解答。
老版本的 ID转换器的数据来源是基于biomart的,这个新版本的ID转换器的数据来源是根据TCGA使用的gtf文件中提取而来,里面记录的信息更为全面一些,这些ENSG编号转换完还是ENSG编号的主要原因是在这个gtf版本中被认为是新发现的,也就是说這些基因的SYMBOL还没有定下来,这也就导致了不同数据库中SYMBOL的名称不同,故此为避免歧异,软件就继续使用ENSG编号了,只有这个在各个数据库中是唯一对应的。
lncRNA也是同理,因为lncRNA存在很多这种情况,所以就会发现里面很多转完也还是ENSG
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!