上一节课我们已经通篇解析待复现文章的整体思路,那么接下来开始我们正题数据预处理,1、GEO数据下载;2、数据选择已经多种标准化处理方法;3、缺失值补全;4、箱线图绘制;5、临床特征样本信息准备。那么下一节就是我们的重头戏,怎么使用一键式WGCNA已经模块筛选。
最近在写工具盒里WGCNA工具的使用教程,检索素材时发现了一篇文章,哦不,是两篇,他们长的几乎一样但是分数却相差近三倍,我们的目的就是零代码完美复现1、数据采用GEO公开数据集;2、老思路,通过sangerbox中的DEcenter来实现差异基因筛选,想必大家已经并不陌生;3、重头戏,sangerbox中的一键式WGCNA分析使用以及讲解老师的个人经验分享;4、结合临床信息筛选关键模块,通过万能的excel实现;5、hub基因筛选,以及预后相关性,在线网站统统搞定;6、最后就是外部数据验证。
CIRCOS图在有了染色体信息界定绘图区域后,就可以向里面添加离散数据如标记特定的区域或连续数据如展示修饰的丰度等。经过前面部分对CIRCOS基本安装,最简单绘图和调整各部分属性的熟悉后
EXCEL是常用的查看表格的工具,提供了很好的数据筛选、绘图等功能,不少基因表达数据也会在EXCEL中打开查看、筛选和排序。还有 3 个超赞的 EXCEL 插件,让你 5 分钟从小白变大神。但是EXCEL也
一键式WGCNA总共需要输入两个文件,九个参数,界面如下: 1、表达谱文件:一个表头为样本,第一列为基因名称的表格矩阵 2、样本文件:一个第一列为样本,后面各列为定义的为样本表型的矩阵...
样本共分有2组 1组样本共有375个 0组样本共有32个 ========= ========= 运行R命令:"C:\Users\kesongs\Desktop\Sanger\source\softs\R-Portable\App\R-Portable\bin\Rscript.exe" "C:\dec_...
技术不小心删了openssl,然后没挽救回来,通过各种折腾终于能进系统了,各方便都感觉修复了,唯独这个R无法正常的使用install.packages和biocLite来安装依赖包,究其原因则是CA证书错误,status...
【往期回顾】 点击文字跳转: 【功能群】 —专利检索下载网站 SCI Translate 8:科技论文全文翻译利器 在校外也可以访问Web of Science 五款在线 PDF编辑工具(几乎解决所有的PDF问题) PPT模板
最近小编发现大家再用小工具时候总是有一些R包安装不上,今天小编交给大家一个方法。这个是很多免安装的R包提供给大家,欢迎大家使用
在做GEO数据挖掘的时候经常会遇到注释信息很老的芯片平台,或者有些芯片平台压根就没提供基因的注释信息,此时要使用这样的芯片着实不好办,我今天就遇到这样的一个芯片平台https://www.ncbi.nl...
这里以GPL570为例 首先我们需要下载GPL570的探针序列: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL570 找到官网链接: 点击进入官网,搜索探针序列:fasta 点击下载,即可得...
Cytoscape已成为网络图绘制的核心工具,基因表达调控网络、蛋白互作网络、miRNA-gene调节关系、分析流程、组织架构等任何与网络、结构、层级有关系的事情都可以用Cytoscape来绘制。前期的教程
### Conda包管理系统Conda是一种通用包管理系统,旨在构建和管理任何语言的任何类型的软件。通常与Anaconda (集成了更多软件包,[https://www.anaconda.com/download/#download](https://www.an...
点击上方蓝字关注生信宝典,换个角度学生信。GeneOntology富集分析是高通量数据分析的标配,不管是转录组、甲基化、ChIP-seq还是重测序,都会用到对一个或多个集合的基因进行功能富集分析。
先上图,后补充
刚好在做课件是有同学问怎么搞到三阴性乳腺癌的表达谱数据,故有此文 首先使用TCGA简易下载工具下载乳腺癌的表达谱和临床随访信息。 问句1: 这是他的临床数据: ER PR在临床随访信息中...
为了临床的童鞋更方便的处理大的表格矩阵,我们开发了一款简易的矩阵操作工具来对大的表格矩阵进行简单的数据处理 该简易矩阵操作工具主要包括以下几个功能: 1、从大的矩阵文件中提取指定列...
在pubmed上利用TCGA的数据及CeRNA假说整合分析所发表的文章已经快五十篇了,他们从不同程度上来诠释CeRNA假说以及应用场景,我们都知道ceRNA全称为competing endogenous RNA,是一种能够竞争结...
GSEA定义: Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。其输入数据包含两部分,一...
ssGSEA顾名思义是一种特殊的GSEA,它主要针对单样本无法做GSEA而提出的一种实现方法,原理上与GSEA是类似的,不同的是GSEA需要准备表达谱文件即gct,根据表达谱文件计算每个基因的rank值,再进...