甲基化芯片注释中的CpG shores, open sea 是什么

在甲基化芯片中,对于CpG位点所在的区域,会有对应的注释信息,比如CpG islands。CpG island是基因组上一段CpG位点密度较高的区域,这个概念是非常常见的 ,出了CpG island 之外,还会有CpG shores, CpG

在甲基化芯片中,对于CpG位点所在的区域,会有对应的注释信息,比如CpG islandsCpG island是基因组上一段CpG位点密度较高的区域,这个概念是非常常见的 ,出了CpG island 之外,还会有CpG shores, CpG  shelves, open sea等情况,这些区域又是如何定义的呢?

有一篇文章详细评估了 450K芯片所检测的CpG位点在人类基因组的分布

Validation of a DNA methylation microarray for 450,000 CpG sites in the human genome

文章从以下几个方面评估了探针的分布情况

在各条染色体上的分布

可以看到450K芯片上的探针覆盖了22条常染色体和两条性染色体上的CpG位点,其中1号染色体上对应的探针最多

在对应的转录本上的分布

CpG位点可能位于基因间区Intergenic, 也可能位于基因上,而这个基因可以是编码基因,也可以是非编码基因。

可以看到,位于编码基因上的探针最多,其次是位于基因间区的探针

在基因组上的分布

将整个基因组划分为Promoter, Body,  3UTR, Intergenic 4种区域,其中Promoter区又细分为TSS200,  TSS1500, 5UTR, ‘1stExon’ 4种情况。
可以看到,位于Pronoter区的探针最多

在各种CpG区域的分布

CpG shores等概念是根据与CpG island的距离进行定义的。
CpG Shores 指的是位于CpG island上下游2kb 以内的区域;CpG Shelves指的是位于CpG shores 上下游2kb以内的区域;open sea指的是CpG islands, CpG shores, CpG shelves之外的其他区域。

可以看到,位于open sea的探针是最多的。

转自:生信修炼手册
  • 发表于 2018-08-22 09:10
  • 阅读 ( 9061 )
  • 分类:其他组学

0 条评论

请先 登录 后评论
不写代码的码农
菜鸟新手

1 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章