10 求助关于乳腺癌TCGA数据中,随访资料相互矛盾的问题

例如,在 ciBioportal 里直接搜索肺转移,可以找到 5 个病人。

但是如果我在 firehouse里下载了完整的 clinical数据,会发现 “patient.follow_ups.follow_up-2.new_neoplasm_event_occurrence_anatomic_site”里还会有一些肺部肿瘤的病人,其中一部分显示是 distant metastasis。attachments-2020-04-MUBRnXWH5e8ff54423f68.png

并且在“patient.first_nonlymph_node_metastasis_anatomic_sites.metastatic_site_at_diagnosis”里还有一部分显示是 lung 的病人。

还有就是我直接在 TCGA 数据库里搜索某病人编号时,发现可以下载临床信息,我就下载了,这里面只有 85 个病人的信息,发现里面又多了一些显示转移的病人。

attachments-2020-04-asV3kETN5e8ff6a45e9da.png

attachments-2020-04-xxfdjStR5e8ff6cdc556f.png

这个文件是指最近一次随访的病人吗? 因此信息不全?

这样一结合,数量就不止 5 个了。而这些自己找到的在 cBioportal上是没有转移情况的信息的。

因此我想问一下大家,请问哪些是可以算作是转移呢? 我肯定希望数据越多越好,但不知道自己找到的那些算不算,还是只有 cBioportal/TCGA 直接能搜索到的才算?

先谢谢大家了!


请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

以最新的随访数据为准

请先 登录 后评论