Fei 的回答 - 生信人

0 赞同

GEO中GPL2507平台，没有genesymbol和ID信息，这样的怎么处理可以... 已采纳

https://www.ncbi.nlm.nih.gov/geo/download/?acc=GPL2507&format=file&file=GPL2507%5FHuman%5FWG%2D6%2Ecsv%2Egz

回答于 2017-10-30 17:17

0 赞同

Python处理如何将相同基因的FPKM算一个平均值再输出

可以用R语言,Transcript ID作为因子变量

回答于 2017-08-04 09:05

0 赞同

TCGA简易下载工具可以在哪里下载使用已采纳

百度网盘下载地址：http://pan.baidu.com/s/1gf7QBkR

回答于 2017-05-16 17:42

0 赞同

TCGA里面的下载的临床XML文件是怎么转临床数据文本的？

可以使用简易TCGA下载工具，百度网盘下载地址：http://pan.baidu.com/s/1gf7QBkR。当下载好临床数据后点击full按钮就可以将单个xml文件转成所有样本的临床信息的一个txt文件啦，详细的软件使用教程https://www.shengxin.ren/article/1。

回答于 2017-04-27 22:31

0 赞同

请问TCGA数据中2种甲基化数据（MethyArray27K和MethyArray450K）...

Liftover工具用于转换不同基因组装配（assemblies）的基因组坐标范围及注释文件。

回答于 2017-04-24 10:05

0 赞同

新版TCGA中表达数据下载后有6万多个ENSG号，其中包含了lncRNA,如...

首先，获取表达谱数据，可以通过简易TCGA下载工具下载胶质瘤数据。其次，获取lncRNA的列表，可以运用https://www.shengxin.ren/question/23里的代码运行得到lncRNA信息根据第一步和第二步得到的文件运行一下代码就可以得到lncRNA的表达谱啦 def getlncRNA(): _file='H:/lncRNA_ID.txt' f=open(_file,'r') ...

回答于 2017-04-13 10:31

2 赞同

python 实战任务之如何提取fasta头部信息已采纳

要提取lncRNA的相关信息，首先，获取lncRNA的分类信息，这个通过notepad++进行处理就可以。下面是处理得到的结果，标上绿色的为lncRNA的类型： import re def findPrix(line,prix,span): txt=line[line.find(prix):len(line)] if txt.find(' ') > -1: txt=txt[span:txt.find(' ')]...

回答于 2017-04-12 16:25

1 赞同

TCGA下载数据中RNA-Seq HTSeq FPKM(UQ)是什么？已采纳

这是两种不同的标准化方法，公式如下：具体细节可以看TCGA的RNA分析的说明文档 https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/Expression_mRNA_Pipeline/

回答于 2017-04-07 10:02

3 赞同

R语言中有哪些包可以处理批次效应已采纳

ComBat是基于经典贝叶斯的分析方法，运用已知的批次信息对高通量数据进行批次校正。在sva R package 中提供了ComBat用于处理批次效应。ComBat有两个方法可供选择，一种是基于参数和一种非参数方法，combat函数的par.prior参数可以设置。函数输入数据为经过标准化的数据矩阵，返回结果为经过批次校正后的一个数据矩阵。 sou...

回答于 2017-03-30 21:56

21 个回答

GEO中GPL2507平台，没有genesymbol和ID信息，这样的怎么处理可以... 已采纳

Python处理如何将相同基因的FPKM算一个平均值再输出

tobacco_smoking_history 1234

TCGA简易下载工具可以在哪里下载使用已采纳

TCGA里面的下载的临床XML文件是怎么转临床数据文本的？

请问TCGA数据中2种甲基化数据（MethyArray27K和MethyArray450K）...

新版TCGA中表达数据下载后有6万多个ENSG号，其中包含了lncRNA,如...

python 实战任务之如何提取fasta头部信息已采纳

TCGA下载数据中RNA-Seq HTSeq FPKM(UQ)是什么？已采纳

R语言中有哪些包可以处理批次效应已采纳

21 个回答

GEO中GPL2507平台，没有genesymbol和ID信息，这样的怎么处理可以... 已采纳

Python处理如何将相同基因的FPKM算一个平均值再输出

tobacco_smoking_history 1234

TCGA简易下载工具可以在哪里下载使用 已采纳

TCGA里面的下载的临床XML文件是怎么转临床数据文本的？

请问TCGA数据中2种甲基化数据（MethyArray27K和MethyArray450K）...

新版TCGA中表达数据下载后有6万多个ENSG号，其中包含了lncRNA,如...

python 实战任务之如何提取fasta头部信息 已采纳

TCGA下载数据中RNA-Seq HTSeq FPKM(UQ)是什么？ 已采纳

R语言中有哪些包可以处理批次效应 已采纳

TCGA简易下载工具可以在哪里下载使用已采纳

python 实战任务之如何提取fasta头部信息已采纳

TCGA下载数据中RNA-Seq HTSeq FPKM(UQ)是什么？已采纳

R语言中有哪些包可以处理批次效应已采纳