你先需要了解一下短序列比对算法,然后再理解blast的算法思想,然后再根据算法思想去用代码实现。 或者你直接用python调用blast程序运行比对。这是一个捷径
回答于 2018-11-21 10:06
再运行一下这个命令: library(GEOquery)
回答于 2018-11-21 10:03
UCSC上的数据是经过处理的,而TCGA上的是最原始的。 60,484行,每一行似乎是一个ENSG基因编码:这是60484个转录本,UCSC上的两万来个是编码基因的表达谱,是从这60484个转录本里面提取出来的子集。 RSEM处理过的数据:这是TCGA老版本使用的RNASeq数据的定量方法,这里的数据也是来源于老版本的,新版TCGA统一使用Counts、...
回答于 2018-11-21 10:02