看教程不够直观,那就看视频吧! >>点击加载视频
海马是一种体形特异的物种:嘴部没有牙齿且呈长管状,全身覆盖硬骨骼,拥有雄性育儿袋,没有腹鳍和尾鳍等。本文对虎尾海马(Hippocampus comes)进行了全基因组测序和从头组装。在其后的比较基因组学分析发现,相比于其他硬骨鱼基因组,海马基因组中蛋白质和核甘酸的进化速率最快。作者又对海马中的虾红素金属蛋白酶基因家族进行检测,发现了显著扩张且在海马雄性育儿袋中高度表达的基因家族。同时,作者还发现海马中缺失了富含辅氨酸/谷氨酰胺的分泌型钙结合磷蛋白(P/Q-rich SCPP),而这类基因主要参与釉质的合成,因此作者推测这可能就是导致海马没有牙齿的原因。之后作者发现调控后肢发育的基因tbx4在海马中同样缺失,而将斑马鱼中的 tbx4基因敲除后,产生了一种与海马一样没有腹鳍的表型。
海龙科(海马,海龙鱼,海龙)拥有约3000个物种,且体形和生殖方式特异。为了研究海马的特异体形及繁殖方式的遗传基础,作者对虎尾海马进行了全基因组测序并与其他鳍刺鱼类进行了比较基因组学分析。
测序材料为雄性海马,构建插入片段大小在170 bp~20 kb之间的文库,利用Illumina HiSeq 2000测序获得190 Mb高质量数据(过滤低质量和复制之后的reads)。
1、基因组组装、注释
初步评估得到基因组大小为695 Mb,利用SOAPdenovo组装得到基因组大小为501.6 Mb,contigN50为34.7 kb,scaffoldN50为1.8 Mb。对RNA数据进行从头组装,用于评估组装效果,结果99%以上的基因组拥有该组装转录组的支持(即基因区覆盖度评估)。并且CEGMA评估结果显示,该组装基因组拥有243个核心基因组(一共248个),组装效果较好。
基于同源物种线纹海马(lined seahorse, Hippocampus erectus)和转录组进行基因预测,最终得到23,458个基因。其中97%能注释到Swissprot,Trembl和KEGG数据库。通过进化分析发现,共有25个基因家族发生扩张,有54个基因家族发生收缩。预测到转座元件占组装基因组的24.8%。
2、比较基因组学分析
将虎尾海马与近缘物种进行聚类,提取单拷贝基因后利用蛋白序列构建进化树,并利用MCMCTree评估得出海马与其他硬骨鱼类发生分化的时间约在1,038亿年前。更为有趣的是,相比于其他硬骨鱼类,海马在蛋白树中的枝长更长,说明海马中蛋白质的进化速率更快。作者又以同样方法证明了海马比其他硬骨鱼类中核苷酸的进化速率更快。至于海马进化速率更快的原因,目前还不清楚。
3、P/Q-rich SCPP基因缺失与海马无牙有关
基因和基因功能的缺失可能会产生新的进化从而被正向选择。因此作者对海马中缺失的基因进行了分析,从而寻找与海马特异表型相关的基因。
分泌型钙结合蛋白(SCPP)基因主要编码细胞外基质蛋白,该蛋白与骨骼、牙本质、搪瓷和釉质等矿化物质的形成相关。SCPP基因大致可分为两类:酸性SCPP(acidic SCPP)基因和脯氨酸/谷氨酰胺富集SCPP基因(P/Q-rich SCPP)。酸性SCPP主要调控骨骼和牙本质的矿化,而P/Q-rich SCPP则主要参与搪瓷和釉质的形成。作者在海马中找到了两个酸性SCPP基因:scpp1和spp1。但未找到P/Q-rich SCPP的功能基因,只找到一个P/Q-rich SCPP的假基因:scpp5。我们知道海马和海龙都没有牙齿,除此之外的鸟、乌龟和一些哺乳动物也没有牙齿。且已有研究证明鸟、乌龟和这些哺乳动物没有牙齿的原因,是抑制了P/Q-rich SCPP基因中搪瓷特异基因和牙本质特异基因的突变。由此,作者推测海马无牙可能是与P/Q-rich SCPP基因的完全缺失有关。
4、OR基因家族最小
对海马和其他鳍刺鱼类的OR基因家族进行比较,发现海马的嗅觉受体(OR)基因只有26个,是迄今为止所有鳍刺鱼类中最少的(60~69个OR基因)。
5、tbx4基因缺失与没有腹鳍相关
海马还有一个重要的体型特征就是没有腹鳍。已有研究发现在河豚中,腹鳍的缺失会伴随着hoxd9a基因表达量的变化;而在鳍刺鱼中,腹鳍的缺失是因为腹鳍特异的增强子pitx1发生了删除。
作者发现在颌类脊椎动物中十分保守的转录因子tbx4,在海马中完全缺失了。tbx4基因在哺乳动物中主要参与调控下肢的形成发育,如老鼠中该基因的失活会导致其下肢无法发育成形。由此,作者推测海马中腹鳍的缺失很可能与tbx4基因有关。为了验证这个猜想,作者将斑马鱼中的tbx4基因敲除,结果确实除了腹鳍消失外,没有其他明显体形变化。
6、patristacin家族扩张与雄性生育相关
雄性生育是海马拥有的非常独特的进化方式。在硬骨鱼中,虾红素金属蛋白酶家族中的C6AST亚家族能够引起绒毛膜的裂解,辅助胚胎孵化。研究发现H.comes中存在6个pastn基因,这些基因属于C6AST亚家族,并且在海马育儿袋中能够高表达。利用近源物种H.erectus(更容易养殖成活,并且生殖周期和编码序列都与H.comes十分相似)的转录组进行分析,发现了5个H.comes中pastn基因的同源拷贝,并且这些基因在怀孕早期和晚期时表达量都很高(与未怀孕时期相比)。作者由此推测pastn基因在海马发育袋的发育中起重要作用。但作者还发现了一个有趣的现象:雌性生育的剑尾鱼(platyfish,X.maculatus)中竟发现了6个c6ast基因(同属于C6AST亚家族),这说明C6AST家族在这两个种系中发生了不同的扩张,并且这种扩张造成了种系之间生育方式的差异。
7、CNE缺失分析
许多保守的非编码元件(conserved noncoding elemens,CNEs)都具有顺式调控元件的功能。于是作者以斑马鱼为参考基因组,来预测H.comes和其他4个鳍刺类鱼中缺失的CNEs,并分别统计每个物种中特异性缺失的CNEs。比较后发现,海马中缺失的CNEs最多,达1,612个。作者又对缺失CNEs最多的区域进行研究,发现该区域附近的20个基因(如sall1a,shox和irx5a)与四肢、神经系统、肾脏、心脏、骨骼系统的发育有关。
为了验证在H.comes中缺失但在其他硬骨鱼中存在的CNEs具有顺式调控功能,作者挑选了7个只在H.comes中缺失的CNEs进行分析。发现其中4个CNEs在转基因斑马鱼中可以使基因重新恢复到初始的表达量,由此作者推测H.comes中缺失的CNEs在其他硬骨鱼中是具有顺式调控功能的。
作者通过对多个调控元件的分析,来破解海马特异体形的奥秘。提醒我们进化不仅可以通过改变基因起作用,也可以通过调控元件来实现。文末,作者还推测顺式调控元件,尤其是增强子的缺失和获得,很可能是造成表型发生变化的重要因素。作者对海马进行的基因组测序分析和比较基因组学分析,揭示了海马特异体形的原因。
参考文献
Lin Q, Fan S, Zhang Y, et al. The seahorse genome and the evolution of its specialized morphology.[J]. Nature, 2016, 540(7633):395.
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!