SangerBox下载TCGA转录本数据合并后癌症和癌旁组织区分

各位大佬,你们好,我用SangerBox下载TCGA某种肿瘤的转录本数据合并后,发现样本ID并不是那种标准的好几段,好像有几处字段缺失,所以无法区分癌症和癌旁组织,请问大家是如何区分的?attachments-2018-09-bGZO9uiC5b8e9b3e8987a.png下载后如上图 

attachments-2018-09-ST7VzHYv5b8e9b6605c05.png和这有些不同

请先 登录 后评论

3 个回答

zhuxiaoer - 医学生

建议最好还是高明宝barcode的由来,到TCGA百科全书,上面有详细的解释,因为在01-10以内其实有一些数字是表示转移瘤

请先 登录 后评论
祝让飞 - 生物信息工程师

看前15位 就够了 后面的一般用不上

请先 登录 后评论
disciplinant - 登山爱好者

是的,跟这个barcode不一致,你可以根据最后一个字段数字来区分;10以内的为癌(如01),10以上的为癌旁(如11);供参考

请先 登录 后评论