看教程不够直观,那就看视频吧! >>点击加载视频
系统生物学研究面临的一个重大挑战是不同的数据类型需要用到相对应的分析软件进行可视化等,而且这些分布范围比较广泛。为了个好的研究,每个物种都需要一个可以结合所有数据的强大的研究平台。今天给大家介绍一个这方面的工具ePlant(http://bar.utoronto.ca/eplant),一句话概括工具的强大就是易于使用,涵盖大于12个数量级的植物数据(如基因,蛋白质组,相互作用,转录组和3D分子结构等),收录了大于20种不同种类的全基因组数据。
不同层次的生物体之间联系是非常复杂的,咱们直接上图,小编已是看的眼花缭乱,比如拟南芥种子发育可能侧重于一个特定的转录因子基因ABI3,但在哪个水平的分析?环境因素可导致DNA多态性被保留,导致蛋白质序列和结构水平上不同群体的自然变异。这些水平上的微妙变化可以影响信号传递和信号转导级联,蛋白质相互作用网络,代谢,亚细胞定位,时空分布和各种生态型的最终表型反应,真的是太深奥、太复杂。
对于这么庞大复杂的联系网,研究起来就需要翻阅几十个网上无数篇文章,这样容易导致信息超载,压力增加,决策准确性降低;但是如果这些数据被整合到一起,那研究起来必然是方便很多。
ePlant分类是按照从“大”到“小”的等级分级,主要几大部分的图形介绍
A:World eFP Viewer显示了从世界不同地区收集的生态型的基因表达水平的自然变异,根据给定信息结合谷歌地图,可以显示气温、气压等使研究人员能够快速了解生态型在回应环境时可能会有所不同;
B:Plant eFP Viewer通过根据来自多个实验的基因表达水平动态着色植物的图形表示的组织来显示所选择的基因的表达模式,如例就是基于Schmid等人研究的在拟南芥各个发育阶段ABI3基因表达水平的数据进行绘制图片;
C:Tissue & Experiment eFP Viewer提供了关于个体组织中基因表达的细节级别信息以及扰动反应实验结果,这样能快速解答哪个组织,在什么情况下,我的感兴趣的基因是最高的表达等的问题;
D:Subcellular Localization eFP Viewer显示基因产物在细胞内的定位,其中颜色梯度表示所选基因的蛋白质产物的置信度分数,这个功能BAR(http://bar.utoronto.ca/cell_efp/cgi-bin/cell_efp.cgi)也可以实现;
E:Chromosome Viewer提供了植物染色体的图形概述和下载的所有基因的位置,可用于快速确定共表达基因的物理位置;
F:Protein Interaction Viewer显示所选基因和预测的蛋白质-蛋白质相互作用(PPI)和蛋白质-DNA相互作用(PDI),它使用节点链接绘图方法,其中节点表示蛋白质或DNA序列,并且链接表示这些元素之间的相互作用;
G:Molecule Viewer将信息从四个独立的数据库映射到所选蛋白质分子结构的模型上。
H:Sequence Viewer能够实现数据的微观到宏观层面的探索,同时提供详细信息和概述级别的信息。
编后语:
随着测序技术的发展和成本的降低,越来越多的物种的基因组被探究,数据也越来越多。从海量的存量数据中挖掘、检索信息变得极为困难,尤其是对那些没有生物信息学背景的研究者来说。面对PB级别的数据将这些结果进行整合和优化是一个必然趋势,现在国外已经有很多公司针对科研用户进行相关的数据库的构建,优化检索、加速分析、便捷科研。
告别测序,不做测序的附庸,生信人认为盘活存量数据,优化数据挖掘,以个性化生信分析服务立足,这不仅仅能体现数据的价值,更能体现生信人的价值。
关注数据价值,关注生信人!
参考文章
Waese J, Fan J, Pasha A, et al. ePlant: Visualizing and Exploring Multiple Levels of Data for Hypothesis Generation in Plant Biology[J]. Plant Cell, 2017:tpc.00073.2017.
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!