15 TCGA基因表达(HTSeq-FPKM)的样本名称和临床资料(Clinical merge)的样本名称不一样,如何对应?

attachments-2018-06-Ap4wDeGb5b22f34908576.png

attachments-2018-06-kRWaY9fL5b22f35339a3d.png我下载TCGA基因表达(HTSeq-FPKM)数据和临床资料(Clinical merge)数据,最后想挑选部分样本行生存分析,发现表达数据的样本名称是“TCGA-DB-A4XH-01”这种形式(图2),但是临床数据的样本名称又是“TCGA-75-5147”这种格式(图1),如何对应?

请先 登录 后评论

1 个回答

disciplinant - 登山爱好者

临床数据都是病人(患者)的随访数据,表达数据里含有对照样本。利用Excel中的数据菜单下的分列工具,可以对表达数据中的样本编号分列后,获得和临床信息中对应的编码;这是把编码对应的办法;另外,就是如果你做生存分析,批量生存分析,可以直接使用工具盒中的小工具,不需要进行编码,会自动匹配。具体可以参考https://www.shengxin.ren/article/209,注意把数据表达信息第一行作为样本名称,临床信息第一列作为样本名称,然后回自动匹配分析。

请先 登录 后评论
  • 1 关注
  • 0 收藏,6695 浏览
  • zhurui 提出于 2018-06-15 07:00

相似问题