建模的精髓:可靠性>方法

总结:这篇文章构建模型的方法非常简单,门槛不高。 建模可以有很多角度:关键基因,诊断,复发风险,耐药,转移,预后等等等等 数据可以有多种维度:mRNA miRNA lncRNA,CNV,SNP,甲基化等等等等 要把更多的篇幅放在模型鲁棒性的检验上

老规矩,先放参考文献:https://clinicalepigeneticsjournal.biomedcentral.com/articles/10.1186/s13148-018-0574-0   

多说一句,Clin Epigenetics这个杂志在5-6分数段表现的非常稳定,大家可以到桑格助手去查一下。

这个杂志位于肿瘤学2区,肿瘤学和表观方向文章都可以收,这意味着什么?

如果是多组学的研究,工作量足够,可以考虑这个杂志啊

webp

研究背景:

DNA甲基化与卵巢癌的发生发展具有很高关联。

DNA甲基化作为生物标志物监测治疗反应和预测预后具有很高潜力。

CpG岛的特定子集的甲基化可能对特定的肿瘤发生过程有影响。

异常的DNA甲基化在肿瘤中通常发生并且是公认的致癌最早区别分子特性之一。

与其他分子标记相比,DNA甲基化具有多种优势(具体看原文)

分析流程:

1.数据选取:选取OSC患者TCGA 甲基化27K数据551个样本(我看了一下,现在一共有613个样本,作者剔除了一些样本)

webp

2.样本剔除标准:a.包含临床信息b.G1,GB和GX期的样本(一种肿瘤级别的划分,不同肿瘤分期称呼不同,不做深究 )

3.样本分组:前2/3作为训练集,后1/3作为验证集(基本等同于随机分组)

4.数据分析(R统计软件包(R版本3.4.4))

1.首先在训练数据集中进行单变量Cox比例风险分析以识别甲基化标记(P<0.05)  ,发现总共1630个DNA甲基化位点与患者的OS显着相关。

2.对这1282个DNA甲基化位点进行多变量Cox回归分析,进一步筛选得到5个甲基化位点的风险模型(g05254747,cg13652336,cg25123470,cg06038133和cg04907664)

进一步研究表明cg13652336,cg25123470和cg06038133的高甲基化水平与较高的风险相关,而cg05254747和cg04907664的低甲基化水平与较高的风险相关。

webp

这5个位点相对应的基因编号是SLC39A14,PREX2,KCNIP2,CORO6和EFNB1

3. 随后,使用AUC来检测和比较模型性能——五个DNA甲基化标记的AUC为0.715(P <0.001,95%CI 0.62-0.81)这表明五个DNA甲基化标记具有较高的敏感性和特异性

webp

4.年龄其实是卵巢癌预后风险的重要因素,把年龄考虑进去之后,再次评估5甲基化模型的性能:

根据初诊时的年龄将患者分为三组:≤50(N = 127,23.05%),51-60(N = 178,32.30%)和> 60(N = 246,44.65%)分析五-DNA甲基化标记在不同年龄患者中的临床效果。

webp

尽管不同组疾病进展不同,但是模型的性能仍然是令人满意的。

5.与过往的多种预后诊断标记相比较:

对比对象包含多mRNA模型,单甲基化模型,单基因模型和多基因模型

作者构建的5甲基化模型具有更好的稳定性和灵敏性

webp

总结:这篇文章构建模型的方法非常简单,门槛不高。

建模可以有很多角度:关键基因,诊断,复发风险,耐药,转移,预后等等等等

数据可以有多种维度:mRNA miRNA lncRNA,CNV,SNP,甲基化等等等等

要把更多的篇幅放在模型鲁棒性的检验上

  • 发表于 2020-03-25 16:13
  • 阅读 ( 2495 )
  • 分类:默认分类

0 条评论

请先 登录 后评论
不写代码的码农
生信分析流

FBI

55 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章