你这个是 以文件的 ID 作为文件名称的,真正的样本名称在配置文件里面
从TCGA数据库GDC下载肺腺癌LUAD文件,但不知道如何区分哪些是癌,哪些是癌旁,希望前辈能指点一下。
这个问题本人先是网络检索过,看到一个答案说到:
“举个样本例子给大家:
TCGA-02-0001-01C-01D-0182-01 这个代码中,最重要的就是第四个字段,也就是01C,准确的说01对我们来说非常重要,这个sample的数字是从01-29的,其中01-09是tumor,也就是癌症样本;其中10-29是normal,也就是癌旁”
但是,我下载的文件名没有这种格式的,比如case ID
或者file name
此外,下载“JSON”文件也看不到癌和癌旁的信息
对各位大神的回答感激不尽,谢谢
怪自己粗心,在“cart”页面看到“metadata”,里面有详细信息