看教程不够直观,那就看视频吧! >>点击加载视频
癌症作为一种复杂疾病,是多基因异常情况下,最终导致通路的失调,进而机体异常[1]。对预后相关基因的识别不仅可以提高对预后的判断能力,而且可以更好地理解癌症发生的潜在机制。同时,通过生物学通路去探索癌症发生、诊断以及预后的机制[2,3]。但是,一个通路包含的基因太多了,并不是所有的基因都是重要的基因,因此,从这些通路中进一步挖掘子通路,这些通路与单个基因一样具有预测性,但子通路在生物学背景下功能更强,更易于解释[4]。然而,目前传统识别基因预后标志物的方法存在鲁棒性差的问题,可移植性差。所以今天小编就和大家分享一篇关于癌症预后的文章【Briefings in Bioinformatics -- A novel high-frequency sub-pathway mining approach to identify robust prognostic gene signatures -- 发表时间:2019.7.27 --IF:6.72】来解决这个问题
癌症作为一种复杂疾病,是多基因异常情况下,最终导致通路的失调,进而机体异常[1]。对预后相关基因的识别不仅可以提高对预后的判断能力,而且可以更好地理解癌症发生的潜在机制。同时,通过生物学通路去探索癌症发生、诊断以及预后的机制[2,3]。但是,一个通路包含的基因太多了,并不是所有的基因都是重要的基因,因此,从这些通路中进一步挖掘子通路,这些通路与单个基因一样具有预测性,但子通路在生物学背景下功能更强,更易于解释[4]。然而,目前传统识别基因预后标志物的方法存在鲁棒性差的问题,可移植性差。因此,针对这一现象,在2019年7月,Li等人将随机策略和子通路挖掘的方法相结合,开发出HiFreSP(high-frequency sub-pathways mining approach,高频子通路挖掘方法)算法去识别更鲁棒的癌症预后标志物,该方法对训练集噪声鲁棒,并能有效防止过拟合。并在ESCC(食管鳞状细胞癌),PAAD(胰腺癌)、BRCA(乳腺癌)以及TCGA数据库中包含20种癌症(n = 8137)的数据集中得到验证。其中,在ESCC疾病中,Li等人识别出了由6个基因(CCND1,CSF3R,E2F2,JUP,RARA和TCF7)构成的预后标志物。接下来,他们进一步将HiFreSP算法识别到的预后标志物与Lasso cox以及RSF(随机森林)预后模型识别到的标志物的预后能力进行比较,发现HiFreSP预后评估性能和鲁棒性最好。Li等人将HiFreSP算法思想的代码存放在GitHub上(https://github.com/chunquanlipathway/HiFreSP),以便感兴趣的研究员方便使用。
(1)训练集:ESCC芯片数据GSE121931(n = 125),对该数据通过RMA标准化和log2转化;
(2)测试集:额外的3套ESCC数据集、2套PAAD数据集、4套BRCA(ER+)数据集和TCGA数据库中20种癌症(n = 8137)数据集。
(3)HiFreSP算法思想,如Fig 1所示:
i.构造训练集
ii.识别预后相关的基因
iii.识别预后相关的通路
iv.计算高频基因(HFG)以及高频通路得分(HFP)
v.结合HFG和HFP识别预后相关子的通路
参考文献:
1. Cancer
Genome Atlas Research Network. Comprehensive
molecular characterization of clear cell renal cell carcinoma.
Nature 2013;499(7456):43–9.
2. Huang
S, Yee C, Ching T, et al. A novel model to combine
clinical and pathway-based transcriptomic information for
the prognosis prediction of breast cancer. PLoS Comput Biol
2014;10(9):e1003851.
3. Zhang C, Li C, Li J, et al. Identification of miRNA-mediated core gene module for glioma patient prediction by integrating high-throughput miRNA, mRNA expression and pathway structure. PLoS One 2014;9(5):e96908
4. Meng J, Li P, Zhang Q, et al. A four-long non-coding RNA signature in predicting breast cancer survival. J Exp Clin Cancer Res 2014;33(1):84.
生信文献解读(1)多组学数据的生存分析识别胰腺癌中的预后标志物
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!