关于RNA-Seq数据去接头(Adapter)这事需要讲一讲

首先来了解一下三个概念: 1、adapter是一段短的序列已知的核酸链,用于链接序列未知的目标测序片段。 2、barcode,也称为index,是一段很短的寡居核酸链,用于在多个样品混合测序时,标记不同的样品。 3、insert是用于测序的目标片段,因为是包括在两个adapter之间,所以被称为“插入”片段。

  • 4
  • 9
  • 祝让飞
  • 发布于 2017-06-03 19:04
  • 阅读 ( 17613 )

推荐一个软件:GFFview

A Web Server for Parsing and Visualizing Annotation Information of Eukaryotic Genome 大家好,今天给大家推荐一款软件,GFFview ,顾名思义这款软件主要用于gff文件的可视化展示。 相信...

  • 2
  • 2
  • 张海伦
  • 发布于 2017-06-03 10:31
  • 阅读 ( 7527 )

畅想未来的测序

这几天代表公司参加了Pacbio测序在武汉召开的会议,收获很多,特意跟大家分享下。 小编在学校学习的时候,由于就读于医科院校,老师经常会跟小编和小编的同学们讲,未来每个人都有一个基因身份...

  • 0
  • 1
  • 百迈客
  • 发布于 2017-06-02 11:32
  • 阅读 ( 2237 )

R语言做主成分分析实例

主成分分析法是数据挖掘中常用的一种降维算法,是Pearson在1901年提出的,再后来由hotelling在1933年加以发展提出的一种多变量的统计方法,其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异,也可以用来削减回归分析和聚类分析中变量的数目,与因子分析类似。

  • 5
  • 4
  • 祝让飞
  • 发布于 2017-06-01 12:37
  • 阅读 ( 12717 )

GO的obo文件解析Python代码

在现在的组学研究中几乎离不开GO分析,那么GO是干什么的呢,GO的诞生主要目的是来归类 统一生物学方言的(不同的生物学数据库可能会使用不同的术语),它是一个有向无环图(DAG)本体,主要形式是一term标记,每个GO term代表一种功能描述,都属于ontology,而GO总共分成三个ontology:molecular function, cellular component和biological process

  • 0
  • 5
  • 祝让飞
  • 发布于 2017-05-30 18:00
  • 阅读 ( 7666 )

微生物多样性分析神器Qiime的centos 6.7的安装历程

QIIME (Quantitative Insights Into Microbial Ecology)是一个专门针对于微生物群落的分析pipline,可以进行OTU,以及多样性分析等等。拥有处理16s rRNA所需要的软件并呈现相应的处理结果。所谓分析pipline必是集成软件,QIIME也不例外。因此安装起来超级麻烦。

  • 0
  • 3
  • 祝让飞
  • 发布于 2017-05-26 21:39
  • 阅读 ( 6628 )

纯三代向日葵基因组登上Nature

看见文章小编只能说“又一个基因组被纯三代测序组装给攻克了”,吃瓜子群众看好了! 研究背景   向日葵是重要的经济作物,其地位,小编不阐述了。想象一下,闲来无事,看看电视,嗑嗑瓜子是...

  • 1
  • 1
  • 百迈客
  • 发布于 2017-05-25 07:26
  • 阅读 ( 4326 )

记录宏基因组分析时去除嵌合体没有usearch 64-bit怎么破

在做细菌16S的高通量数据处理时你不得不面对去除嵌合体这玩意,嵌合体是什么鬼,百度一下就知道了,在序列扩增时多数序列是顺着单条序列前进的,如Read1扩增产生新的Read1,Read2扩增产生新的Read2。但有时两条序列也可能缠在一起,扩增时产生的新序列前半段可能属于Read1,后半段属于Read2,形成了拥有两条序列信息的嵌合体序列

  • 0
  • 4
  • 祝让飞
  • 发布于 2017-05-22 19:05
  • 阅读 ( 4951 )

TCGA miRNASeq 数据生存分析

基于简易小工具下载TCGA表达数据做生存分析。软件工具:R。参考教程:https://www.biostars.org/p/153013/。有建议或问题希望指出,互相促进互相学习:)

  • 20
  • 11
  • 金晓妍
  • 发布于 2017-05-22 05:46
  • 阅读 ( 16640 )

RCricos绘制简单圈图

RCricos绘制简单圈图

  • 2
  • 2
  • 爽儿
  • 发布于 2017-05-20 10:25
  • 阅读 ( 6660 )

R语言可以这么玩 |高质量图片这样导出!

众所周知,可视化是统计中不可缺少的一部分,也是很直观的传递信息的一种方式,并且SCI文章投稿最重要的也是对于图片的处理。 一般杂志对图片要求:图片最低分辨率300DPI,部分杂志要求不低于6...

  • 10
  • 13
  • 易统计
  • 发布于 2017-05-17 14:04
  • 阅读 ( 66174 )

欧洲银桦基因组登上Nature genetics!

最近随着三代测序的火热,纯三代的基因组文章也遍地开花!技术的提升必然带来的基因组质量的提升,但是对做研究而言,最终还是得落到物种自身。下面这篇文章告诉你,没有熊猫血,怎么关注爆表。...

  • 1
  • 2
  • 百迈客
  • 发布于 2017-05-16 17:50
  • 阅读 ( 4343 )

组装技术的新进展

1、测序和组装 很难想象今天距离提出测序和组装已经有40年啦。我们回头来看一下这个问题。 “With modern fast sequencing techniques and suitable computer programs it is now possible...

  • 0
  • 2
  • 张海伦
  • 发布于 2017-05-16 17:35
  • 阅读 ( 2104 )

Weinberg教授继的癌症综述

简述了最近10年肿瘤学中的热点和进展,包括细胞自噬、肿瘤干细胞、肿瘤微环境等等,并且将原有的肿瘤细胞六大特征扩增到了十个.

参考简易TCGA下载小工具简单介绍TCGA

TCGA产生背景       目前人们研究最多的疾病非癌症莫属。从人类基因组计划完成后,癌症研究也早已步入基因组学时代,正因如此,人们急需一个能整合多种癌症基因组测序数据的功能强大的数据库平...

  • 17
  • 12
  • 金晓妍
  • 发布于 2017-05-07 22:28
  • 阅读 ( 6423 )

菜鸟第一次提取TCGA编码蛋白基因和lncRNA表达谱

TCGA 编码蛋白基因和lncRNA表达谱提取简介

  • 10
  • 6
  • 爽儿
  • 发布于 2017-05-07 18:13
  • 阅读 ( 11099 )

茶基因组解析

茶是世界上最古老,最受欢迎的含咖啡因的饮料,具有极大的经济,药用和文化价值。栽培茶树山茶的重复序列高达80.9%,基因组大小伟3.02Gb。文章发现,由于几个LTR反转录转座子家族的缓慢,稳定...

  • 2
  • 6
  • 百迈客
  • 发布于 2017-05-05 16:55
  • 阅读 ( 7310 )

海马基因组文章解读

  斯须九重真龙出, 一洗万古凡马空。   龙是中国人的图腾,可以目前尚不确定其是否存在,目前也更没有相关的基因组研究,但是16年测过一个海龙科的物种,也就是海马基因组。接下来详细的给大家...

  • 1
  • 2
  • SXR
  • 发布于 2017-05-04 09:24
  • 阅读 ( 6150 )

R语言可以这么玩 |绘制地图与地点数据可视化

本期是我们R语言可以这么玩系列第四期。 小蟹君今天又来给大家介绍R的玩法了。这次,我们用R来画地图吧,利用可视化工具,我们更能轻松地得出结论哦~

  • 0
  • 4
  • 易统计
  • 发布于 2017-05-02 10:46
  • 阅读 ( 14522 )

小编的感想

人生分为三个阶段,呐喊、彷徨、朝花夕拾。 目前生信分析犹如接近而立之年的男生,稚气已退,成熟未满。 曾几何时,生信分析由于测序高昂,分析高冷,而被束之高阁,那是何等的忧伤寂寞,从业...

  • 1
  • 1
  • 张海伦
  • 发布于 2017-04-27 17:42
  • 阅读 ( 1804 )