建模的精髓：可靠性>方法

总结：这篇文章构建模型的方法非常简单，门槛不高。建模可以有很多角度：关键基因，诊断，复发风险，耐药，转移，预后等等等等数据可以有多种维度：mRNA miRNA lncRNA，CNV，SNP，甲基化等等等等要把更多的篇幅放在模型鲁棒性的检验上

多说一句，Clin Epigenetics这个杂志在5-6分数段表现的非常稳定，大家可以到桑格助手去查一下。

这个杂志位于肿瘤学2区，肿瘤学和表观方向文章都可以收，这意味着什么？

如果是多组学的研究，工作量足够，可以考虑这个杂志啊

研究背景：

DNA甲基化与卵巢癌的发生发展具有很高关联。

DNA甲基化作为生物标志物监测治疗反应和预测预后具有很高潜力。

CpG岛的特定子集的甲基化可能对特定的肿瘤发生过程有影响。

异常的DNA甲基化在肿瘤中通常发生并且是公认的致癌最早区别分子特性之一。

与其他分子标记相比，DNA甲基化具有多种优势（具体看原文）

分析流程：

1.数据选取：选取OSC患者TCGA 甲基化27K数据551个样本（我看了一下，现在一共有613个样本，作者剔除了一些样本）

2.样本剔除标准：a.包含临床信息b.G1，GB和GX期的样本(一种肿瘤级别的划分，不同肿瘤分期称呼不同，不做深究）

3.样本分组：前2/3作为训练集，后1/3作为验证集（基本等同于随机分组）

4.数据分析（R统计软件包（R版本3.4.4））

1.首先在训练数据集中进行单变量Cox比例风险分析以识别甲基化标记（P<0.05），发现总共1630个DNA甲基化位点与患者的OS显着相关。

2.对这1282个DNA甲基化位点进行多变量Cox回归分析，进一步筛选得到5个甲基化位点的风险模型（g05254747，cg13652336，cg25123470，cg06038133和cg04907664）

进一步研究表明cg13652336，cg25123470和cg06038133的高甲基化水平与较高的风险相关，而cg05254747和cg04907664的低甲基化水平与较高的风险相关。

这5个位点相对应的基因编号是SLC39A14，PREX2，KCNIP2，CORO6和EFNB1

3. 随后，使用AUC来检测和比较模型性能——五个DNA甲基化标记的AUC为0.715（P <0.001，95％CI 0.62-0.81）这表明五个DNA甲基化标记具有较高的敏感性和特异性

4.年龄其实是卵巢癌预后风险的重要因素，把年龄考虑进去之后，再次评估5甲基化模型的性能：

根据初诊时的年龄将患者分为三组：≤50（N = 127，23.05％），51-60（N = 178，32.30％）和> 60（N = 246，44.65％）分析五-DNA甲基化标记在不同年龄患者中的临床效果。

尽管不同组疾病进展不同，但是模型的性能仍然是令人满意的。

5.与过往的多种预后诊断标记相比较：

对比对象包含多mRNA模型，单甲基化模型，单基因模型和多基因模型

作者构建的5甲基化模型具有更好的稳定性和灵敏性

总结：这篇文章构建模型的方法非常简单，门槛不高。

建模可以有很多角度：关键基因，诊断，复发风险，耐药，转移，预后等等等等

数据可以有多种维度：mRNA miRNA lncRNA，CNV，SNP，甲基化等等等等

要把更多的篇幅放在模型鲁棒性的检验上

0 条评论