近期可以模仿的数据分析pipeline汇总

本次文章很多，需要细品，再仔细品。

第一篇文章来自，19年影响因子8.378

文章标题是Genetic and Environmental Determinants of Immune Response to Cutaneous Melanoma

大家可以通过doi自行查看，doi.org/10.1158/0008-5472.CAN-18-2864

文章主要做的是一个事情是鉴定黑色素瘤的不同亚型，并且阐述不同亚型中差异基因的变化，基因组CNV的变化，还有某一基因在不同亚型中对预后的关系和对PDL1的免疫响应。

背景和论述的过程大家可以看一下原文，不太难懂，我们主要讲一下结论和分析的pipeline

重要结论：

1.基于免疫细胞得分构建了不同免疫响应亚型，并且亚型之间确实存在显著的预后差异。

2.通过对不同响应亚型组之间的差异表达基因进行富集分析，发现MYC，NFKB1基因与这种免疫响应之间的关系

3.CNV分析表明在不同的响应亚型组之间MYC，NFKB1基因的突变频率也有显著的差异

4.对各组进行临床特征分析发现smoking是高免疫响应亚型的风险因子

文章用到的数据比较多，包含TCGA带有临床特征的数据 GEO数据 CNV数据和突变数据。

第二篇文章来自Oncoimmunology，实时的影响因子是5.333

文章题目Two immune-enhanced molecular subtypes differ in inflammation, checkpoint signaling and outcome of advanced head and neck squamous cell carcinoma

文章链接：doi.org/10.1080/2162402X.2017.1392427

先看分析结果：

文章的分析方法也相对好梳理：

1、首先筛选具有预后信息的 TCGA\GEO 数据集 2、下载收集免疫相关基因集。 3、利用免疫相关基因集表达谱进行分子分型 4、主成分分析亚型特异性 5、筛选不同分子分型特异表达基因 6、分析不同分子分型中的临床特征 7、分析不同分子分型中免疫细胞、基质细胞评分等免疫浸润的关系，寻找免疫增强/抑制相关亚型。 8、免疫检查点基因在不同亚型中的差异分析 9、不同亚型的预后差异分析 10、共表达筛选免疫增强/抑制亚型的特征基因 11、构建分类模型预测免疫增强/抑制亚型 12、外部数据集验证