https://www.ncbi.nlm.nih.gov/geo/download/?acc=GPL2507&format=file&file=GPL2507%5FHuman%5FWG%2D6%2Ecsv%2Egz
回答于 2017-10-30 17:17
回答于 2017-08-02 20:36
可以使用简易TCGA下载工具,百度网盘下载地址:http://pan.baidu.com/s/1gf7QBkR。当下载好临床数据后点击full按钮就可以将单个xml文件转成所有样本的临床信息的一个txt文件啦,详细的软件使用教程https://www.shengxin.ren/article/1。
回答于 2017-04-27 22:31
Liftover工具用于转换不同基因组装配(assemblies)的基因组坐标范围及注释文件。
回答于 2017-04-24 10:05
首先,获取表达谱数据,可以通过简易TCGA下载工具下载胶质瘤数据。 其次,获取lncRNA的列表,可以运用https://www.shengxin.ren/question/23里的代码运行得到lncRNA信息 根据第一步和第二步得到的文件运行一下代码就可以得到lncRNA的表达谱啦 def getlncRNA(): _file='H:/lncRNA_ID.txt' f=open(_file,'r') ...
回答于 2017-04-13 10:31
要提取lncRNA的相关信息,首先,获取lncRNA的分类信息,这个通过notepad++进行处理就可以。 下面是处理得到的结果,标上绿色的为lncRNA的类型: import re def findPrix(line,prix,span): txt=line[line.find(prix):len(line)] if txt.find(' ') > -1: txt=txt[span:txt.find(' ')]...
回答于 2017-04-12 16:25
这是两种不同的标准化方法,公式如下: 具体细节可以看TCGA的RNA分析的说明文档 https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/Expression_mRNA_Pipeline/
回答于 2017-04-07 10:02
ComBat是基于经典贝叶斯的分析方法,运用已知的批次信息对高通量数据进行批次校正。在sva R package 中提供了ComBat用于处理批次效应。ComBat有两个方法可供选择,一种是基于参数和一种非参数方法,combat函数的par.prior参数可以设置。函数输入数据为经过标准化的数据矩阵,返回结果为经过批次校正后的一个数据矩阵。 sou...
回答于 2017-03-30 21:56