参考文献 Wagner, G.P., Kin, K. & Lynch, V.J. Measurement of mRNA abundance using RNA-seq data: RPKM measure is inconsistent among samples. Theory Biosci. 131, 281–285 (2012).
为了解决四个难题我们设计开发了“GSEA简易分析工具”和” GSEA结果可视化工具”
“在生信分析之前对数据进行清洗,其过程对后续的分析起的重要的作用,有时直接影响结果的好坏”
这篇文章今年1月份发表在J Cell Mol Med上;文章只有两套数据,一套训练集和一套验证集;作者构建的模型AUC也不是很高,但是文章的分数发了4.6分。 主要原因是作者能够将很多常规分析串起来,这些分析大家在泛癌课程和之前分享的文章、小工具推文中大家都接触过。 所以小编提议大家多看文章,英文看不懂,没有关系,可以先看小编的解读,再看看原文,锻炼自己的思维。
“Identifcation of the key genes and pathways involved in the tumorigenesis and prognosis of kidney renal clear cell carcinoma” 肾脏肾透明细胞癌的发生,发展及预后的关键基因和途径的鉴定 发表于: 2020年3月6日, Scientific Reports 杂志上,还是热乎的。
limma包是2015年发表在Nucleic Acids Resarch一个做差异分析的工具,目前引用次数高达七千多次。Limma包是基于voom的算法,它既可以对芯片数据进行差异分析,也可以对转录组高通量测序数据进行差异分析。
limma包是2015年发表在Nucleic Acids Resarch一个做差异分析的工具,目前引用次数高达七千多次。Limma包是基于voom的算法,它既可以对芯片数据进行差异分析,也可以对转录组高通量测序数据进行差异分析。
批次效应表示样品在不同批次中处理和测量产生的试验期间记录与任何生物变异无关的技术差异。
01 — 研究背景 上一篇公众号我们为大家详细的介绍了R软件包limma筛选差异基因,limma包做差异分析要求数据满足正态分布或近似正态分布,如基因芯片、TPM格式的高通量测序数据。随着高...
前两期公众号给小伙伴们推荐了两个做基因差异分析网页交互式小工具,很多小伙伴私信小编说,用网页小工具做差异分析,结果文件中的火山图默认只展示差异倍数(即logFC)最大的前十个基因。
记得在两年前刚学生信时,和很多小伙伴一样,在做完差异基因分析或者进行基因特异性筛选时,发现结果有几百个甚至上千个基因。心里想,这么多基因,如果每一个基因去NCBI、Gene Card等公共数据库上去注释基因功能,等注释完了,黄花菜都凉了。
为了解决生信小白的困难,我们公司研发的一个网页板的小工具,里面内置了包括Ensembl、GPL570等常用的注释平台文件,你只需要上传自己的表达谱矩阵,点击鼠标即可完成各种ID之间的转换,非常方便。这么好的平台,亲们准备好了吗,和我一起去体验吧。
“ 根据将缺失值和缺失值周围距离最近的k个值,其中距离方式可以选择欧式距离和马氏距离,用这k个值的中值或均值代表这个缺失值”
“做cox比例分析和KM曲线结合分析,阈值该怎么选取,数据是否需要标准化等等问题的解决方法”
省时又省力,几百个基因做生存分析,挑选对样本的生存状态有显著影响的基因,然后用这些基因进行进一步的做生存分析,绘制ROC曲线。
“做cox比例分析和KM曲线结合分析,阈值该怎么选取,数据是否需要标准化等等问题的解决方法”
“绘制高颜值的基因表达高低与患者生存状态的关系图”
“小提琴图 (Violin Plot) 用于显示数据分布及其概率密度”
如果是以文件的格式将数据导入到云平台,平台默认无法读取Excel中的数据,必须将Excel文件转为以制表位符分割的文本文件,否则小工具将无法运行。
“原来需要大半天才能做出一个图,现在的小工具几分钟就可以搞定,关键还是高颜值,棒棒的!”