王诗翔
王诗翔 - 研究生在读

性别: 上海 - 上海市 注册于 2017-12-03

有问题https://github.com/ShixiangWang/MessageBoard/issues创建issue探讨

向TA求助
19金币数
450 经验值
8个粉丝
主页被访问 4232 次,0,

26 个回答

0 赞同

ROC曲线下面积AUC值怎么比较??

pROC包有个roc.test

回答于 2018-12-14 14:07

1 赞同

请问下如果我做多基因预测模型的话,risk score如何要设立?

并不是很懂,不好意思。 从图来看,这个beta值应该是生存分析的系数。

回答于 2018-09-02 18:33

0 赞同

TCGA数据库下载下来的数据从哪里看数据的变量名代表什么含义啊?...

你是在GDC下的嘛?查下专门的文件格式,GDC有专门的文档的

回答于 2018-08-07 15:44

0 赞同

急啊,从GEO下载的series_matrix文件,解压之后得到TXT,3.95G,...

notepad plus 免费轻量。 这么大的文件本来就不是让你用编辑器打开的,建议使用R、Python或者Linux工具读入少量文本行观察后进行处理。

回答于 2018-08-07 15:29

1 赞同

做癌症驱动基因预测,从哪些数据库可以下载到包含已知驱动突变和...

貌似没有啊。这些都是靠不同的算法预测的,你得看文章找方法咯

回答于 2018-02-25 16:13

0 赞同

癌症驱动基因和癌症驱动突变有何区别和联系?乘客基因和乘客突变...

驱动突变是致癌的主体,乘客突变可能无用,可能起到了辅助作用。其实根据这个意思也能理解,你把癌症的发展想象成开车,那些对细胞有很多几率致癌的突变看作司机,而一些随机或者无义的突变看作乘客,但是并不代表后者没有用。 1. 驱动突变常常位于驱动基因 2. 乘客突变常常位于乘客基因 3. 癌症驱动突变不一定是错义突...

回答于 2018-02-22 22:47

0 赞同

TCGA临床信息——tobacco_smoking_history 中1,2,3,4,5 分别表示什...

吸烟程度,谷歌可以找到,具体忘了

回答于 2018-02-16 23:40

0 赞同

tcga下载的fpkm要用什么r包进行处理?

第一个问题你其实百度就可以解决,完全没必要在这里问。前者是对比直接形成的读段计数,后者是为了解决基因(转录本)长度不同而对表达值估计造成影响而设计的一个转换,具体百度吧。常用R包,EdgR,DEseq2等,它们对表达分布的概率分布估计使用的分布函数不一样,其他我记不清有什么差别了。很多人有过类似的疑问,百度找篇文...

回答于 2018-02-13 18:39

0 赞同

为什么制作热图的时候一直在显示绘图?

你能具体说明一下吗?用的软件还是编程语言?

回答于 2018-02-10 16:25

2 赞同

GEO芯片数据表达值很小,且有负值,标准化后不在一条直线

你可以通过GEO官网先看一看你使用的经过什么预处理。标准化之后不在一条直线?什么意思呢?

回答于 2018-02-07 20:30