数据挖掘CeRNA网络构建数据预处理

TCGA数据据是由美国国家癌症研究所(NCI)及国家人类基因组研究所(NHGRI)联合建立,其包含丰富的肿瘤数据类;ceRNA其主要基于竞争性内源RNA假说解释mRNA、假基因、长链非编码RNA之间如何通过miRNA反应元件进行“对话”。本节主要数据准备和预处理。

上节课基础已经打好,本章就开始实操

本期视频我们讲解基于TCGA数据构建mRNA-miRNA-lncRNA三元网络关系

1、TCGA数据库中下载好的数据标准化,用到的工具是SangerBox中的简易标准化工具

attachments-2018-11-eBbI1cMP5bee4b23b5f09.png

attachments-2018-11-XFxST7o35bee4bf564d31.png

2、标准化后的数据介绍,癌与癌旁样本从编号上的区别,第一列ID的命名规则

attachments-2018-11-YZeehisW5bee4ba48fb0a.png

3、lncRNA和mRNA数据如何从标准化后的数据中提取,这里同样无需编程,使用便捷ID转换器即可;

attachments-2018-11-KBp5N6Jj5bee4c938abf0.png

4、lncRNA数据已经准备完成,TCGA中miRNA数据的处理过程。

attachments-2018-11-0kh2OJQJ5bee4d4c3a72e.png

本章主要前期数据准备工作,但是我们找到的mRNA、lncRNA和miRNA成千上万,如何从中挑选最具代表意义,请看下讲视频


attachments-2018-11-9BZZanyN5bee4e2a11f63.png

#104

  • 发表于 2018-11-16 12:58
  • 阅读 ( 4006 )
  • 分类:基因组学

0 条评论

请先 登录 后评论
不写代码的码农
调研图

38 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章