临床数据都是病人(患者)的随访数据,表达数据里含有对照样本。利用Excel中的数据菜单下的分列工具,可以对表达数据中的样本编号分列后,获得和临床信息中对应的编码;这是把编码对应的办法;另外,就是如果你做生存分析,批量生存分析,可以直接使用工具盒中的小工具,不需要进行编码,会自动匹配。具体可以参考https://www.shengxin.ren/article/209,注意把数据表达信息第一行作为样本名称,临床信息第一列作为样本名称,然后回自动匹配分析。
我下载TCGA基因表达(HTSeq-FPKM)数据和临床资料(Clinical merge)数据,最后想挑选部分样本行生存分析,发现表达数据的样本名称是“TCGA-DB-A4XH-01”这种形式(图2),但是临床数据的样本名称又是“TCGA-75-5147”这种格式(图1),如何对应?
临床数据都是病人(患者)的随访数据,表达数据里含有对照样本。利用Excel中的数据菜单下的分列工具,可以对表达数据中的样本编号分列后,获得和临床信息中对应的编码;这是把编码对应的办法;另外,就是如果你做生存分析,批量生存分析,可以直接使用工具盒中的小工具,不需要进行编码,会自动匹配。具体可以参考https://www.shengxin.ren/article/209,注意把数据表达信息第一行作为样本名称,临床信息第一列作为样本名称,然后回自动匹配分析。
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!