你好,学生最近在做WGCNA做到模块与临床信息相关联时遇到困惑,想问一下面对TCGA临床资料里的非数值型变量该如何处理,谢谢!
我记得原帖里就是非数值变量吧,做的是乳腺癌亚型与基因表达的关联,如果是二分类变量的话,写成0,1就可以了,
同样可以计算相关性的。WGCNA那本书上用的是肝癌小鼠的例子,是和体重挂钩的。
如果是其他分类有标度的话,我觉得你只需要根据数据类型是否有序,给一个标度就可以了,因为最后刻画的是相关性,我觉得应该没有什么影响,你可以尝试一下哈。