下载TCGA数据的工具

TCGA数据如何下载,吼吼。

1、TCGA简介

美国政府发起的癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症(近期目标为50种包括亚型在内的肿瘤)的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型“预防癌症的策略”。

TCGA 使命:提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力

TCGA 目标:完成一套完整的与所有癌症基因组改变相关的“图谱”。


biocc_ec598dc9_cedb_41f1_938f_e427c6adc7

2、下载数据工具介绍


TCGA数据源大部分都是公开的,如何有效的进行收集和预处理 是一个头疼 的问题。


首先下载数据的方法有如下几种


官网、cBioPortal、ICGC、TCGA-Assembler、GenePattern


3、工具使用详解


(1)直接去官网下载。这个具体参考其官网的操作文档就可以啦。


(2)cBioPortal

biocc_9d557391_1703_4829_9016_28e411013f


点击下载数据按钮之后,可以按照目前研究的癌症的类型和发表的年代进行选择,然后选择相应的数据类型,比对snp突变,拷贝数变异和表达谱数据等。


biocc_02121d02_6000_414d_a1b9_f20e79a82b


这个工具最好的地方在于 ,你可以选择你感兴趣的基因,然后点击submit提交,坐等下载就可以啦。当然这个工具还是支持一些在线分析的。


(3)ICGC

biocc_ce9bf940_8930_4318_bb4c_0f4ae23ea9


ICGC 可以在搜索框中直接搜索你感兴趣的癌型。然后回车,选择相应的数

据。


biocc_32f41055_d9eb_46e7_abaa_9d5d96c7c0


选择相应的数据,然后点击下载。


biocc_9f31f002_e51b_46f3_9ca4_393f397839



然后选择想要下载的数据类型。


biocc_83fde3db_0fb0_479b_9b41_58aace1178

然后坐等下载,就可以啦。


(4)TCGA-Assembler


可以使用TCGA-Assembler这软件去下载TCGA的数据http://www.compgenome.org/TCGA-Assembler/。TCGA-Assembler不但可以很方便的下载数据,还能对数据进行初始化处理,非常方便。下载完后,我们使用首先要安装一些依赖包。通过下面的命令:
install.packages(c("HGNChelper", "RCurl", "httr", "stringr", "digest", "bitops"), dependencies=T)

安装完了依赖包,我们进入刚才下载的TCGA-Assembler的目录,使用setwd(C:/Users/cloud/Desktop/TCGA-Assembler)设置TCGA-Assembler的目录为工作目录,接下来,我们就可以下载数据了。我们需要下载什么数据,就选择相应的脚本。具体代码见丁香网有具体的讲解


(5)GenePattern。小编没有具体用过,大家伙自己去尝试吧。


这些工具使用起来还是有其局限性,都不能够轻易获取每个癌症类型的二维数据矩阵(例如基因为rows,样本为columns)。


参考资料

http://www.cbioportal.org/public-portal/cgds_r.jsp

http://dcc.icgc.org/download/current

http://www.compgenome.org/TCGA-Assembler/ 

http://www.broadinstitute.org/cancer/software/genepattern/download/index

http://www.dxy.cn/bbs/topic/31315813

http://emuch.net/html/201403/7089959.html


  • 发表于 2017-03-28 20:31
  • 阅读 ( 8677 )
  • 分类:软件工具

3 条评论

请先 登录 后评论
不写代码的码农
SXR

44 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章