看教程不够直观,那就看视频吧! >>点击加载视频
TCGA简易下载工具上线一周,有许许多多的同志们使用它来下载TCGA数据,也有部分同志反应了一些问题,也是这些问题让这个工具更新到了第六个版本,经过六次的更新,也解决了不少在极端情况下的下载使用问题,现在总结一下问的比较多的软件问题,新版软件截图如下:
Q1、最新版增加了断线重连的功能,这解决了软件下载时老是卡住的问题,这里面涉及到一个参数“超时时间”,这里默认的是10s,如果你网速比较差那么需要设的高一点,比如我设1000s,这样就是在1000s内如果数据下不下来就启动重新下载。
Q2、判断能不能使用软件,请先访问这个链接:https://gdc-api.nci.nih.gov/files/5565529a-4299-4d4e-adc0-b4e92ddee252?pretty=true,如果访问成功则可以使用软件,不能访问则无法使用软件进行下载,你需要切换网络
Q3、文件合并失败问题,请看这个回答:https://www.shengxin.ren/question/17
Q4、ClinicalFull和Clinical的区别,前者是提取所有的临床病理资料,比较大有时候可能有几百项,后者是提取常见的几种比如死亡时间,复发时间,TNM分期等等,有些癌症类型的TNM分期可能提取不出来,需要使用前者的那个功能
Q5、ENSG_ID转换为什么转出来比原来的少,首先你可以看程序目录下ENSG_ID.txt,这是收录ENSG与geneSymbol的文件,因为有些ENSG并没有对应的geneSymbol所以结果中少是正常的,如果你有其他的转换想法,比如只想提取lncRNA,你可以自己手动的编辑ENSG_ID.txt这个文件,然后再运行程序。
Q6、明明显示有一百多样本,下载下来只有几十个或者没有?这是由于你勾选了癌与癌旁的复选框,可以去除复选框就能下载全部的样本。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!