TCGA简易下载工具使用总结

TCGA简易下载工具上线一周,有许许多多的同志们使用它来下载TCGA数据,也有部分同志反应了一些问题,也是这些问题让这个工具更新到了第六个版本,经过六次的更新,也解决了不少在极端情况下的下载使用问题,现在总结一下问的比较多的软件问题

TCGA简易下载工具上线一周,有许许多多的同志们使用它来下载TCGA数据,也有部分同志反应了一些问题,也是这些问题让这个工具更新到了第六个版本,经过六次的更新,也解决了不少在极端情况下的下载使用问题,现在总结一下问的比较多的软件问题,新版软件截图如下:

attachments-2017-04-yi2degLX58ecca8ce035


Q1、最新版增加了断线重连的功能,这解决了软件下载时老是卡住的问题,这里面涉及到一个参数“超时时间”,这里默认的是10s,如果你网速比较差那么需要设的高一点,比如我设1000s,这样就是在1000s内如果数据下不下来就启动重新下载。

Q2、判断能不能使用软件,请先访问这个链接:https://gdc-api.nci.nih.gov/files/5565529a-4299-4d4e-adc0-b4e92ddee252?pretty=true,如果访问成功则可以使用软件,不能访问则无法使用软件进行下载,你需要切换网络

Q3、文件合并失败问题,请看这个回答:https://www.shengxin.ren/question/17

Q4、ClinicalFull和Clinical的区别,前者是提取所有的临床病理资料,比较大有时候可能有几百项,后者是提取常见的几种比如死亡时间,复发时间,TNM分期等等,有些癌症类型的TNM分期可能提取不出来,需要使用前者的那个功能

Q5、ENSG_ID转换为什么转出来比原来的少,首先你可以看程序目录下ENSG_ID.txt,这是收录ENSG与geneSymbol的文件,因为有些ENSG并没有对应的geneSymbol所以结果中少是正常的,如果你有其他的转换想法,比如只想提取lncRNA,你可以自己手动的编辑ENSG_ID.txt这个文件,然后再运行程序。

Q6、明明显示有一百多样本,下载下来只有几十个或者没有?这是由于你勾选了癌与癌旁的复选框,可以去除复选框就能下载全部的样本。


  • 发表于 2017-04-11 20:46
  • 阅读 ( 6547 )
  • 分类:软件工具

4 条评论

请先 登录 后评论
不写代码的码农
祝让飞

生物信息工程师

104 篇文章

作家榜 »

  1. 祝让飞 104 文章
  2. 合肥国肽生物 99 文章
  3. 刘永鑫 64 文章
  4. SXR 44 文章
  5. 调研图 37 文章
  6. 生信分析流 33 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章