3 ID转换时部分ENSG不转换为gene symbol

ID转换出现了新的问题,就是我此前进行过ID转换,单独转换提取编码基因(mRNA),数量有变化,这个是其中一个疑问点。现在是19754个成功转换。以前也做过,跟这个不一样,不过大概也是这个范围1万9千多个;另外一个问题是,其中有一些仍然是ENSG号码,没有转换为Gene Symbol,不知道是为什么。我在genecard中根据ENSG号码可以查到相关的基因。另外,我把没有转换为Gene Symbol的ENSG提取出来,单独弄一个文件进行ID转换,仍然是同样的结果。下附图:

attachments-2018-02-U288YfoT5a80eea03dc7a.png求解。

附:lncRNA中这种情况更多,只有少部分是非编码RNA名称。对非编码RNA关注很少,这个作为扩展问题吧。感谢老师解答。

请先 登录 后评论

2 个回答

王晓明 - 武大硕士

楼上说的应该是没问题的,我也遇到过一些ENSG转换不了,而且这些转换不了的在NCBI里都查不到对应的gene,你可以试试。

请先 登录 后评论
祝让飞 - 生物信息工程师

老版本的 ID转换器的数据来源是基于biomart的,这个新版本的ID转换器的数据来源是根据TCGA使用的gtf文件中提取而来,里面记录的信息更为全面一些,这些ENSG编号转换完还是ENSG编号的主要原因是在这个gtf版本中被认为是新发现的,也就是说這些基因的SYMBOL还没有定下来,这也就导致了不同数据库中SYMBOL的名称不同,故此为避免歧异,软件就继续使用ENSG编号了,只有这个在各个数据库中是唯一对应的。

lncRNA也是同理,因为lncRNA存在很多这种情况,所以就会发现里面很多转完也还是ENSG

请先 登录 后评论
  • 2 关注
  • 2 收藏,11304 浏览
  • disciplinant 提出于 2018-02-11 17:04

相似问题