如题所示,该平台的gene symble信息非常的乱,不知道如何提取,请大神指点一下
用sangerbox里的sepmap和基因注释进行重注释
代码难弄的时候,有个笨办法。就是把探针列和gene symble列提取出来,在excel里用vlookup命令查找出哪些探针在我们的数据里,然后进行排序,就可以完成匹配了。还有就是有一些注释文件没有固定的gene symble列,但是可以看出来在哪一列,是不是用 / 来分割的。是的话也可以用excel根据/进行分裂,从而提取到gene symble信息