爱学习:手把手教你复现一篇Nature子刊的基于WGCNA的生信分析+实验验证的文章

“Identifcation of the key genes and pathways involved in the tumorigenesis and prognosis of kidney renal clear cell carcinoma” 肾脏肾透明细胞癌的发生,发展及预后的关键基因和途径的鉴定 发表于: 2020年3月6日, Scientific Reports 杂志上,还是热乎的。

摘要分解


背景

----------

肾脏肾透明细胞癌(KIRC)是最常见的肾细胞癌(RCC)。然而,由于早 期检测和预后预测的生物标志物有限,KIRC患者通常预后较差。


思路

----------

1、从包括26个肿瘤和26个相邻正常组织样本的阵列数据集中分析了KIRC涉及的关键基因和途径。

2、通过富集分析发现肿瘤样品中上调的基因参与先天免疫反应,而下调的基因则促进葡萄糖,氨基酸和脂肪酸的细胞分解代谢。

3、使用WGCNA软件包进行加权基因共表达网络分析,并确定了与KIRC的相关性最高的20个模块。

4、通过蛋白质-蛋白质相互作用(PPI)网络与共表达网络相结合来评估关键基因。


结果

----------


肿瘤中AGXT,PTGER3和SLC12A3的相对较低表达与KIRC患者的预后较差有关,而ALOX5的较高表达预示生存期缩短。

意义:阐明了参与KIRC肿瘤发生的中心基因,为预后标志物的发展提供了线索。进一步了解已鉴定的KIRC枢纽基因的功能可以提供对KIRC分子机制的深入了解。阐明预后标志物的发展为进一步了解已鉴定的KIRC枢纽基因的功能可以提供对KIRC分子机制的深入理解。


工作流程

----------

attachments-2020-05-VvdTB7lr5ed0e697473ec.png

        从工作流程中我们可以看到本研究首先下载了GEO数据库中的GSE66272数据集的原始数据,通过数据处理得到表达谱,根据数据集中的26个癌症样本和26个癌旁样本进行了差异表达分析,进一步的利用差异基因进行功能富集分析,蛋白互作网络构建和WGCNA共表达网络构建,通过共表达网络确定了20个共表达模块并从这些模块中筛选了hub基因,通过富集分析确定这些hub基因的功能,进一步的将这些hub基因与差异基因构建的蛋白互作网络进行联合分析,最终筛选了20个hub 基因作为关键基因,然后使用TCGA数据库的数据和RT-qPCR进行了验证。



以上是这篇文章的整体思路,可以说是非常容易上手,也是非常典型的生信分析之后加实验验证的文章,涉及到的生信技能如下:

1、GEO数据的下载和处理

2、差异表达分析

3、功能富集分析

4、WGCNA共表达网络构建及模块筛选

5、蛋白互作网络构建

6、关键基因的筛选和鉴定

7、TCGA数据库验证


我们录制了一套视频教你鼠标点点点完成以上分析,傻瓜式操作,帮你节约更多的时间可以放在生物学发现上,快速助你文章产出。




视频PPT如下:

attachments-2020-05-5oTLy2045ed0e6c259d9d.png

视频地址:      http://sangerbox.com/SangerBoxClassroom


  1. 视频获取方式:
       attachments-2020-05-aNsALz8X5ed0e6e2401f6.png

长按识别

回复:【WGCNA视频】

即可免费领取,有效期至2020.6.1

【注意】请扫描上方二维码进入后台回复,其他公众号回复无效。




文章的主要结果


1、鉴定KIRC患者与正常对照之间差异表达的基因

----------

从GSE66272的表达矩阵中鉴定26个肿瘤和26个相邻正常组织样本之间的差异基因,设置差异阈值:FDR <0.05和调整的p值<0.0001,总共筛选了8763个差异表达基因(DEG)用于后续分析,这些差异基因中最小表达倍数是0.349。在这些DEG中,在肿瘤中上调了4287个基因,下调了4476个基因。

注意:差异阈值设置的比较奇怪。



2、差异基因的KEGG和GO富集分析

----------

通过DAVID网站进行GO和KEGG富集分析,GO分析结果表明肿瘤中上调的基因主要富含信号转导,免疫反应,凋亡过程,先天免疫反应和炎症反应装配,而下调的基因则富含氧化-还原过程,转运,跨膜转运,细胞内信号转导和代谢过程。KEGG分析结果表明上调的DEGs丰富了癌症,PI3K-Akt信号通路,HTLV-1感染,病毒致癌,细胞因子-细胞因子受体相互作用,吞噬体,结核,单纯疱疹感染,系统性红斑狼疮和甲型流感的途径,而下调的DEGs富含代谢途径,抗生素的生物合成,碳代谢,缬氨酸,亮氨酸和异亮氨酸降解,甘氨酸,丝氨酸和苏氨酸代谢,过氧化物酶,脂肪酸降解,蛋白质消化和吸收,PPAR信号传导途径和紧密连接。


总的来说,KEGG和GO分析都强烈表明参与免疫反应的基因表达明显增加,而与细胞分解代谢相关的基因表达则明显减少。

注意:富集分析结果的解读很到位


3、构建加权共表达网络以识别关键模块

----------

使用WGCNA构建加权共表达网络,选择邻接函数的加权参数(软阈值β= 20)以确保无标度网络。总共纳入8763个DEG用于构建加权基因共表达网络。通过动态树切割和合并相似模块的方法检测到了20个共表达的基因模块,可以通过聚类树状图可视化。我们发现所有20个模块与样本类型均显示出显着相关性。

attachments-2020-05-GEsBaSRx5ed0e7bf4b560.png


4、共表达模块的基因富集分析

----------

鉴定出二十个模块与样品的临床类型显着相关。为了进一步了解DEG在KIRC中的功能,我们对20个模块中已确定的DEG进行了GO和KEGG通路富集分析。在这20个模块中,存在许多与KIRC发生密切相关的BP和通路,包括黑色模块中的有丝分裂细胞周期。一价无机阳离子稳态和对氰模块中的缺氧反应; 免疫效应过程,氧化还原过程和循环系统发育。这些基因在多个信号传导途径中富集,包括黑色模块中的细胞周期,棕色模块中癌症的中央碳代谢,绿色模块中的细胞因子-细胞因子受体相互作用,粉红色模块中的Ras信号通路等。HIF-1信号通路富含多个模块,包括青色,粉红色和浅黄色模块。这些显着丰富的GO和KEGG通路术语使我们能够更好地了解DEG在KIRC的肿瘤发生和预后中的作用。

注意:写作手法

attachments-2020-05-GAxCVC9o5ed0e7ed047bf.png

5、通过WGCNA和PPI鉴定Hub基因

----------

为了识别中枢基因,我们首先根据从STRING分析工具获得的STRING谱图构建了DEG的PPI网络。基因度≥10的基因被认为是DEG中的中枢基因。在这项研究中,有20个模块与样本类型显着相关。通过模块连接性定义,在20个模块中共表达网络中有282个中枢基因,两者取交集共有30种基因,包括PTGER3,IDO1,GDA,ALOX5,SLC12A3,RUNX3,GPC5,SAMHD1,UPB1,CALML3,SELLPG,PKLR,PAG1,GNB4,INPP5D,TLR4,VCAN,SLC22A11,通过WGCNA和PPI网络分析确定了LOX,CCND2,AGXT,KCNJ10,GBP5,BCAT1,TGFB1,NEK2,PRODH2,HCLS1,ANGPT2和BIRC3,然后筛选出它们进行进一步验证。

attachments-2020-05-gFCZ6UKX5ed0e830023ca.png

6、中枢基因验证

----------

在30个候选中枢基因中,我们使用基于TCGA的GEPIA筛选出了与训练数据集中的正常组织相比明显增加或减少的中心基因的表达。其中只有四个中枢基因表达水平与总生存相关,p值小于0.05。我们在肿瘤样品中鉴定了三个具有较低mRNA水平的基因(AGXT,PTGER3和SLC12A3),这三个基因的高表达患者表现出延长的生存期。相反,ALOX5在肿瘤中显示出更高的mRNA表达水平,ALOX5表达水平高的患者生存率较低。然后,我们收集了12个KIRC样本以及邻近的正常组织样本,以验证KIRC患者中关键枢纽基因的表达。一致地,我们发现肿瘤样品中ALOX5上调,而肿瘤样品中AGXT,PTGER3和SLC12A3下调。

attachments-2020-05-u0BbseaF5ed0e851c8754.pngattachments-2020-05-Vj6tyBPN5ed0e86b4eb9d.png

咋样,是不是看完跃跃欲试了。

更多傻瓜式生信工具请查看  “SangerBox工具使用讲解”  专辑,解决80%的常见生信分析和绘图!!!

  • 发表于 2020-05-29 18:50
  • 阅读 ( 7844 )
  • 分类:文献解读

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
不写代码的码农
欢乐豆

5 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章