5 按照推文中下载了TCGA中突变的信息后续如何处理

一、进行TCGA数据下载一个maf格式的mutation,接受中有mutect,muse,vanscan,somaticsniper,这四个文件有什么联系。下载的MAF文件可能有两种格式 ,可能是47列,或者120列,这个对后续分析有什么影响?

二、进行TCGA数据下载后这个仅仅有基因的突变型,我想要突变和野生型,怎么合并?并且将每个样本的预后及病理分期进行合并呢?想做一个回归模型,看看某些基因的特定突变和预后关系?

谢谢各位!

请先 登录 后评论

1 个回答

王诗翔 - 研究生在读

mutect,muse,vanscan,somaticsniper是四种不同的预处理流程。MAF的格式一般都是tsv(制表符分隔文件)的吧,列数的多少不重要,重要的是你想要的信息,当然不同的maf文件对后续数据分析的选择性可能不同,我没做过不太清楚。

至于突变和野生型这种东西嘛,如果我没记错,MAF一行是一个突变的记录信息,突变就有一行信息,没有突变就没有。你想要把病人分为突变和野生型很简单啊,如果记录已包含突变位点所在的基因信息,你直接将有该基因信息的和没有的分为两类不就是突变和野生型了嘛;如果maf没有突变对应的信息,如果基因少,直接网上找染色体坐标,然后将在这中间发生突变的病人记录下来再分类,如果多就写程序吧。

请先 登录 后评论
  • 1 关注
  • 1 收藏,7679 浏览
  • 提出于 2018-01-25 17:19

相似问题