生信文献解读(1)多组学数据的生存分析识别胰腺癌中的预后标志物

文章通过对TCGA中的PDAC甲基化以及表达等数据进行分析,使用差异表达,生存分析,功能富集等生信方法,最终识别出了PDAC的预后标志物。

胰腺导管腺癌(PDAC)是最常见和最致命的胰腺癌之一,其5年生存率仅为8%左右,它也是一类异质性的疾病,其中PDAC的侵袭性尤其强。与许多其他癌症一样,PDAC也开始于侵袭性前病变,这为早期发现和早期治疗提供了机会并且即使是高阶的PDAC也可以从预后生物标志物中获益。然而,对于PDAC来说,还未得到早期诊断或治疗预后的可靠生物标志物。今天小编就和大家分享一篇关于PDAC预后标志物的文章【Survival Analysis of Multi-Omics Data Identifies Potential Prognostic Markers of Pancreatic Ductal Adenocarcinoma

attachments-2019-08-nvF1Uztz5d636585e3e3c.png

这是首次利用PDAC患者的多组学数据识别生存相关基因的研究之一。

attachments-2019-08-K563LFK15d63670c73e80.png研究从TCGA数据库中选取153PDAC患者,利用其临床、DNA甲基化、基因表达、小RNA (miRNA)和长链非编码RNA (lncRNA)表达数据进行多组学分析。

attachments-2019-08-UEHKfxwC5d63673bc892a.png

1.全局DNA甲基化分析

attachments-2019-08-X9Y9nUV85d63676de7e80.png                 图1

attachments-2019-08-lmGR3aCT5d63685b5626f.png                表1

attachments-2019-08-0NsOkWbu5d63688d3ef15.png                 表2

在这一部分作者首先使用秩和检验来分析甲基化水平的总体差异。分析结果如图1所示,其中图1A展示出了高甲基化和低甲基化频率。最内层的两个圆圈显示了基因组10mb滑动窗口中高甲基化和低甲基化的密度。而dm-CpGs12个不同基因组亚区分布情况展示在表1和图1C中。图1C以气泡图的形式展示了不同甲基化CpGs在基因组区域的情况,气泡的大小表示dm- cpg的总数,表2展示了每个常染色体每百万碱基对(Mb)的差异甲基化频率。

2.差异表达基因分析

attachments-2019-08-qpFrWL5A5d6368d25987f.png                  图2

在这一部分作者首先TCGA下载146PDAC患者肿瘤和3例正常样本的HTSeq读数,使用DESeq2软件包对其进行差异基因表达分析。经p< 0.05检验后,最终鉴定出90个差异表达基因(蛋白编码80个,lncRNA 7个,反义基因2个,ig-v基因1),结果如图2所示。

3.通路富集分析

attachments-2019-08-mjx2idIz5d63690f77d2d.png                 表3

在这一部分作者对差异甲基化CpGs进行了通路富集分析,KEGG通路富集结果如表3所示。可以看到一些重要的癌症相关通路,如MAPK信号通路,Rap1信号通路,钙信号通路被富集。作者还观察了尼古丁成瘾途径的富集,这一事实也证实了这些患者都是吸烟者。

4.基因表达与生存的相关分析

attachments-2019-08-MI85qhSt5d636970a587d.png                 表4

attachments-2019-08-h0d6WGFK5d636998c4c63.png                 图3

基因和基因组调控位点的差异表达和与患者生存相关,这对于了解PDAC的发生发展是至关重要的。作者通过患者生存和差异表达的综合分析识别出了17个基因(表4)。作者进一步分析启动子区存在dm-CpGs的基因发现,在高、低患者群体中,共有93个CpGs存在显著的生存差异。如果在生存分析中使用p值为0.01,这个数字将进一步下降到4(图3)。

5.粘蛋白家族基因分析

attachments-2019-08-MJsQfRJD5d6369f8cb99f.png                  图4

在DEG分析中可以观察到,MUC2、MUC5B和MUC13在PDAC中显著上调,并且MUC1、MUC6、MUC16均有过表达,但差异无统计学意义(BH调整p值> 0.05)。作者注意到,在PDAC中过表达的MUC5B (BH调节p值= 0.018)启动子区也有两个低甲基化CpGs (cg20911165和cg03609102),这也与MUC5B的表达呈负相关(图4)。而且作者还观察到MUC1、MUC3、MUC4、MUC6、MUC15、MUC17、MUC20和MUC21基因的表达与启动子甲基化呈负相关。

6.预后生物标志物的识别

attachments-2019-08-50DyZDUK5d636a445ae12.png                图5

attachments-2019-08-mYJN5HbM5d636a7333602.png                表5

在表5中可以看到生存分析显示,cg03234186高甲基化组患者的PDAC总生存率较低(HR = 1.7)。作者使用生存分析识别出了与PDAC生存相关的预后marker,生存分析结果如图5所示。

到这里这篇文章的主要内容就介绍完了,总结一下,文章通过对TCGA中的PDAC甲基化以及表达等数据进行分析,使用差异表达,生存分析,功能富集等生信方法,最终识别出了PDAC的预后标志物。


attachments-2019-08-TCSpEXpu5d63826a2f336.png

生信文献解读(1)多组学数据的生存分析识别胰腺癌中的预后标志物

生信文献解读(3)乳腺癌组织病理学与蛋白基因组学相关分析

  • 发表于 2019-08-26 13:15
  • 阅读 ( 323 )
  • 分类:文献解读

0 条评论

请先 登录 后评论
不写代码的码农
蛋壳

19 篇文章

作家榜 »

  1. 合肥国肽生物 113 文章
  2. 祝让飞 104 文章
  3. 刘永鑫 64 文章
  4. 生信分析流 47 文章
  5. SXR 44 文章
  6. 调研图 38 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章