看教程不够直观,那就看视频吧! >>点击加载视频
好的分析和可视化,可以提供大量的信息,同时兼顾简洁优雅。
今天我们抛开实验设计、方法和工作量等因素,仅从文章最吸引人的图片来讨论3分和30分(顶级)文章差距在哪里?
以2017年8月25日发表在Sciences杂志上的封面文章为例,简介顶级文章的图版设计、组合、展示方式,再顺便回想一下您读过的其它文章,尤其是3分级别文章,那差异不言而喻。
此篇Science正文仅有3幅图,但却准确传达了作者多年研究的精华成果,让我们带大家解读一下顶级文章中一图顶千字的妙用。
图 1. 哈扎人肠道菌群随季节变化
本图主要基于16S扩增子测序结果,从组间整体差异,不同时间点各分类学、OTUs种类角度,展示哈扎人肠道菌群随季节变化的特性。
本图有13个子图分为6组,从6个不同的研究角度、分析方法和展示方式来对本图主题进行说明。
(A) PCoA散点图+箱线图:基于无权重UniFrac距离的PCoA展示5个季节间样品的差异,可以看出不同季节间菌群在 PCoA2 轴存在变化,且随时间周期循环,颜色选用蓝、绿、紫即柔和又容易区分,并添加组主体置信椭圆背景色和95%置信区间虚线方便读者观察各组全貌和比较组间主体区别;右侧添加箱线图展示在PCo2轴上旱季和雨季分布存在显著差异,而两个旱季间无显著差异,同时添加拟合曲线突出周期变化的规律;
(B) PCoA+时间序列散点图:B图上部从科水平基于Bray-Curtis距离进行PCoA分析,展示哈扎人和现代人区别;下部在PCoA1轴上再按季节时间顺序分组展示哈扎人菌肠随季节每年周期变化的规律;
(C) 流图 (一种堆叠面积图):各菌门中OTUs累计数量随季节变化(至少在10%样品中检测到的OTUs才用于分析)
(D) 桑基图:拟杆菌门、厚壁菌门OTUs在不同季节中物种动态变化;随着时间变化 ,哪些OTUs保留或消失,哪些新来的,以及在每个阶段中的变化。
(E) 线性判别分析 (LDA,一种限制性排序分析)展示按季节分组最大贡献的OTUs;
(F) 热图展示所有样品在不同季节不同科中OTUs丰度变化,即体现组内样品间重复性,又展示组间的周期变化的差异和规律。
点评:B图上部PCoA中为什么选择科不是OTUs,我估计作者应该是目、科、属、种、OTUs级别都分析过,只是科分类结果更好;PCoA下部时间序列散点图添加拟合,这种展示方式都是根据结果总结归纳,再选择合适的图形展示方式突出结论;C/D图把工业的stream graph和sankey diagram都使用上了,将艺术与生物规律完美结合,可见参与本文可视化的同行绝对是本领域中的顶级团队。很多优秀的顶级文章,一般也是由两、三个顶级团队优势互补的结果。
图2. 哈扎人肠道菌群功能随季节周期循环
本图主要基于宏基因组测序碳水化合物代谢基因的种类、丰度进行分析,揭示哈扎人菌群功能周期的变化和与现代人的差别。
本图有8个子图分为5组,从5个不同的角度主题进行说明。
(A) 箱线图展示宏基因组CAZYome基因Shannon多样性按季节变化和与现代人比较;
(B) PCA分析CAZYome表明哈扎人与现代间此类基因显著差异即为样品间主要差异;
(C) 动植物碳水化合物/粘多糖占CAZYome中比例在哈扎人和现代人间存在显著差异;
(D) 几种CAZymes丰度在哈扎人中周期变化,以及与现代人比较
(E) 抗生素抗性基因多样性,哈扎人低于现代人,且存在季节周期变化
点评:宏基因组中从整体到类别,可分析的结果很多,但结果是用于服务科学问题和故事主线的。其中饮食的不同,主要影响碳水化合物的比例和组成,以及抗性基因的种类和丰度。因此选定好的逻辑出发点和故事主线是高水平文章的重点,这个别人很难帮你。但你有了好思路,找技术达人合作或与课题负责分析的朋友沟通,那是水到渠成和锦上添花的事,即使花费大量时间去美化都是值得的。当然也可自学差异箱线图绘制。
图3. 不同地区人肠道菌群样式与生活方式相关
哈扎人与HMP 16S扩增子公共大数据的比较,进一步强调大尺度上的国家、年龄与菌群的关系。
一张PCoA结合国家、年龄和主要细菌科在1/2轴上分布关系的讨论,证明想要表达的环境因素与菌群结构间的相关程度。
(A) 主图为基于Bray-Curtis距离的PCoA;上图为PCoA1轴坐标按地理分组绘制箱线图并排序,展示地区不同生活方式是菌群差异的最主要因素;左图为PCoA2轴坐标按年龄分组,尤其是存在有婴儿数据与成人差异较大要特别注意。
(B) 密度图展示7大菌门在PCoA1轴上样品的累计密度,可以观察数据分布模式,如单峰,双峰等,用于指导分型和进一步挖掘规律。
点评:(A) PCoA和箱线图在本领域最常用,想要展示传递丰富信息得靠你的科学问题和实验设计,具体绘图和组合的技术障碍,可以在培训班中解决。(B) 分布密度图在转录组、表观组学中极常用,但在微生物组中很少使用,本文将其巧妙的用于展示分类学沿PCoA1轴上分布,与上图顶部中地区分布相遥相呼应,设计之精巧让令我们这群十年生信老司机都十分佩服。
点评
其实此文的样本量并不大,作为时间序列研究仅有一年五个时间点共350个样品,时间点和样本量都比较少;科学问题也不够新颖,因为哈扎人肠道菌群与现代人的差异,早在2014年《Nature Communication》上己经发表,而且当时还测了代谢组。本文特点是研究时间跨度更大,主要发现是肠道菌群随季节的变化,这在现代人中也是很难观察到的(可能多年前北方冬季纯靠储存土豆白菜过冬时,我的肠道菌群季节变化也很明显)。更大的亮点在于,作者在结果的呈现上也是蛮拼的,在逻辑的框架上与图形艺术组合,使简单的结果瞬间B格满满,让广大同行清醒认识到自己离顶级文章的差距有多大。
样品都是13年3月至14年9月采集的,直到17年4月19日投稿,项目从采样至投稿历时超过5年,其中样品测序和数据分析也近4年,现在呈现在我们面前的结果一定是经历上百次反复计算和优化而来的,可以想像作者们为这个项目花费了多少精力了心血。
Reference
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!