如何区分TCGA下载文件是癌组织还是癌旁组织?

从TCGA数据库GDC下载肺腺癌LUAD文件,但不知道如何区分哪些是癌,哪些是癌旁,希望前辈能指点一下。

这个问题本人先是网络检索过,看到一个答案说到:

举个样本例子给大家:

TCGA-02-0001-01C-01D-0182-01 这个代码中,最重要的就是第四个字段,也就是01C,准确的说01对我们来说非常重要,这个sample的数字是从01-29的,其中01-09是tumor,也就是癌症样本;其中10-29是normal,也就是癌旁

但是,我下载的文件名没有这种格式的,比如case ID

attachments-2018-08-twqcvOLS5b6dbfeaa0e52.

或者file name

attachments-2018-08-cEsrrRiH5b6dc0218ef65.

此外,下载“JSON”文件也看不到癌和癌旁的信息

对各位大神的回答感激不尽,谢谢


怪自己粗心,在“cart”页面看到“metadata”,里面有详细信息

请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

你这个是 以文件的 ID 作为文件名称的,真正的样本名称在配置文件里面

请先 登录 后评论