看教程不够直观,那就看视频吧! >>点击加载视频
13年发在GR上有一篇文章主要讲解的是目前比较基因组学对于进化研究和深入理解人类疾病研究的作用。现在跟大家简单分享下。
总所周知,当人类基因组计划刚刚起步的时候,这项工程最大的挑战就是如何高效并且高性价比的获取人的3 Gb左右的基因组。后来随着各个实验室共同努力,尤其是测序技术的突飞猛进。这个问题变成了如何获取较为准确的人的基因组。随着大山羊基因组的发表,三代+光学+HiC技术的联合使用,这也不成问题啦。如今问题已经变成如何深入的理解和挖掘这些测序数据。从比较基因组学的角度上横向来看,随着测序技术的发展,越来越多的哺乳动物被测序完。这些物种的测序对于从更大尺度上研究物种进化、进化机制、适应性研究和人类疾病的深入理解都有很大的帮助。
比较基因组学的原则
序列相似一般代表着功能相近,这个是生物信息学的研究基础,当然这里面也会存在几bp的差异,这些差异也是导致物种多样性的原因。哺乳动物中外显子是相对比较保守的,是利于利用模型来进行实现的。但是其基因的间区和上游的启动子、增强子等调控原件确实较为难模型化的。这些应该是真正意义上导致物种进化的因素。
在考虑人基因组的特征时,应该将考虑其物种背景、考虑其和其他物种之间的联系。在研究其调控原件功能是应该综合考虑多组学的数据。
脊椎动物进化
截止到文章发表之日,哺乳动物一共有了60个深度覆盖的基因组,这对于进化的深入研究很有帮助。有助于我们在更大的尺度上去研究物种进化关系。但是物种多了,信息多了,其物种特性信息就会被丢失。这里就要把握好进化的普遍性和物种的特殊背景。
举一些例子来说明科学家能如何利用多物种数据来讲故事的。
1、Exaptation(扩展适应)
很多人对人类基因组如此大比较好奇,怀疑其有超级多的编码基因,但是事实上大部分基因都是非编码的基因。确切的说,大部分的基因组片段都是TE为了他们自己的目的在基因组上跳来跳去造成的。正是由于TE的跳来跳去导致了很多不同的功能出现。举例人类跟其他29个胎生动物相比,有280000个人类相关的调控因子是从TE变化中来的。(用词可能有点问题,不好意思。心领神会哈)。
随着TE exaptation ,物种相关的行为越高级
2、Y染色体会不会消失?
性别研究一直是科研热点,在人中y染色体会不会消失也是热点问题。
通过观察人的y染色体相对x是丢失了很多的基因和片段,趋于消失。但是通过跟黑猩猩进行比较,发现人的y染色体上发生着较为快速的进化,不仅仅是存在基因的loss,也存在新基因的出现和拷贝。同时通过跟 rhesus macaque (普通猕猴)的y 染色体进行比较,发现人和普通猕猴从祖先继承下来的基因都没有怎么丢失。他们得到如下的结论:y染色体丢掉的那些基因,会让他们丧失染色体交换的能力,这样能更加的保护好y从原始继承的基因,同时原始继承的基因经受着较为严格的纯化选择,所以我们有理由认为人的y染色体不会消失。
另外文章还讲了两个例子,一个是语言的进化是某个关键蛋白的改变(FOXP2)。还有关于人工驯化会加强选择的信号等等。更多的内容欢迎大家阅读原文献。
比较基因组学应用于人类疾病研究
说到这一点,大家可能会有点小吃惊,比较基因组学搞搞进化还可以,跟人类疾病扯关系,是不是为了蹭热度。小编负责任的告诉大家,还真不是。
说最简单的人类某些基因不知道其功能,或者某些已经变成假基因的片段不知道其功能,综合其他的哺乳动物的注释信息,可能理解起来就很简单。在后面深入理解人类疾病的发生上,需要综合各个组学的数据,也同时需要其他物种的注释数据,考虑上物种进化的保守性,这样得到的SNP或者高表达基因才能更靠谱,才能更深入的研究人类疾病。
参考文献
Comparative genomics as a tool to understand evolution and disease
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!