10 在按照生信人网站的一篇文章,做生存分析有不懂得地方

1)按照https://www.shengxin.ren/article/75 一文中在 第三大步  处理临床数据中,文中说时间在第14列,现在用的版本是V8,已经clinicalFull后的文件,应该用哪个列作为时间呢。希望大神们能帮忙看下,可能需要您下载数据才能看。辛苦~

2)在第三大步 的第二小步中 “ID=clinical[0,]”,R中下标不是从0开始的么,这个0是不是错误~

3)还有在文中给出的导入clinicalFull的方法中,出现错误,错误于read.table("ClinicalFull_matrix.txt", nrows = 538, row.names = 1,  : 

  不允许有重复的'row.names' 也就是说第一行有重复的列名,这个该怎么解决呢

请大神们帮忙解答下,不胜感激 


请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

问题1:你需要仔细看一下找到 days to death(死亡的样本就用这个)和最后随访时间(未死亡的就用这个)这两列就行了,详情参考:TCGA临床病理随访资料解读

问题2:R中下标不是从0开始的,从1开始

问题3:你的第一列有重复的名字,你需要找找看哪里重复了,看看为什么重复,酌情处理

请先 登录 后评论