一步一步教你做芯片重注释

这里以GPL570为例 首先我们需要下载GPL570的探针序列: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL570 找到官网链接: 点击进入官网,搜索探针序列:fasta 点击下载,即可得...

这里以GPL570为例

首先我们需要下载GPL570的探针序列:

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL570

找到官网链接:

attachments-2018-08-X2mpqilP5b84fe156ecdf.png点击进入官网,搜索探针序列:fasta

attachments-2018-08-e7zIwFnH5b84fe56d2b10.png点击下载,即可得到我们这个平台的探针序列了

进一步的我们需要准备最新的参考基因组序列文件

我们可以从gencode上下载最新版的基因组参考序列:https://www.gencodegenes.org/releases/28.html

方案一:下载所有转录组序列作为参考序列

attachments-2018-08-Ig2U656I5b84fec055a21.png

我们下载所有转录本的序列文件作为参考序列,进一步的使用简易seqmap软件进行比对,将探针序列比对到所有转录本上

那么我们已经准备好序列文件如:

attachments-2018-08-I7eBddI85b87ea542f403.png下面我们打开 SeqMap序列比对工具 将数据导入软件如:

attachments-2018-08-r6LJ2MOH5b87ea9f5ae5b.png我们选择 错配为0,因为咱们这里的探针序列才25bp,如果比较长的话 可以适当增加错配的数目 这样可以匹配到更多

点击比对,等到比对完成。

attachments-2018-08-YSHnQJmy5b87eb5f5ecdf.png得到比对后的结果文件:

attachments-2018-08-tBBvIGLL5b87eb815f758.png

attachments-2018-08-Mm36XlDd5b87eb9fa27fd.png进一步的我们需要从比对结果中提取出基因和探针的关系,我们使用 基因注释工具

attachments-2018-08-RUwmTheP5b87ebfac6f9e.png

如图,我们将注释结果导入到基因注释工具中,从红色框处 按照一定的规则从里面提取出 探针ID和基因ID,最后 点击 注释 按钮,导出注释结果

attachments-2018-08-wmjt1uhO5b87ec5fbc926.pngattachments-2018-08-V1pk0yoF5b87ec7d22c5d.pngattachments-2018-08-NuC7NsQ45b87ec9cbdb0e.png我们可以看到这样就可以将探针对应到ENSG ID上了,这和TCGA使用的ID 一致,我们可以使用ID转换器从中提取出lncRNA和编码基因的ID。


方案二:

下载基因组序列文件作为参考序列,使用简易seqmap软件进行比对,将探针序列比对到基因组

attachments-2018-08-H8Cc07mG5b87453e25fb8.png

准备序列文件如下:

attachments-2018-08-bpxWoUrE5b87ed2a80fbf.png将数据导入软件进行比对:

attachments-2018-08-weEKwgHA5b87ed520190e.png等待比对完成,再使用基因注释工具对比对结果进行注释,由于我们使用的是全基因组比对,所以探针可能会比对到的区域更多,我们需要一个文件来指导提取探针比对到基因组上的位置对应的基因信息,所以我们需要下载gtf文件,我们还是从gencode上下载gtf文件

attachments-2018-08-vQMSkfqE5b87ee4caf5bb.png

下载完成后倒入 基因注释工具中,进行下一步的基因注释

如图:

attachments-2018-08-zeccVMgy5b8744c07db3d.png

最后依然也可以得到相应的探针注释到基因的结果




  • 发表于 2018-08-28 15:51
  • 阅读 ( 27925 )
  • 分类:软件工具

14 条评论

请先 登录 后评论
不写代码的码农
祝让飞

生物信息工程师

118 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章