看教程不够直观,那就看视频吧! >>点击加载视频
久违的孟德尔随机化开始更新了,在今天的内容中,我将向大家介绍孟德尔随机化的基本概念及其背景知识,并举例说明何时可以使用该方法以及该方法为何能有效解释因果关系。本系列讲解内容主要基于Stephen Burgess和Simon G. Thompson共同撰写的孟德尔随机化图书。
1.1 传统流行病学的缺点
流行病学是对人口健康和疾病模式的研究,传统流行病学研究的一个基本问题是相关性与因果关系。如果我们想解决重要的医学问题、例如确定疾病的病因、评估医学或公共卫生干预措施的影响、优化公共政策、合理安排医疗资源,那么解决这些问题的最佳方法是进行诸如前瞻性随机试验等研究。
在临床研究中对科学假设进行实证检验的“黄金标准”是进行随机对照试验(RandomizedControlled Test,RCT)。该设计涉及将不同的治疗方案随机分配给总体中的实验单位(通常是个人),最简单的形式是将一种“积极治疗方案”(例如,对危险因素的干预)与“对照治疗方案”(无干预)进行比较,并比较该试验各方面的平均结果。在这里,风险因素(我们通常将其称为“暴露”变量)是假定的因果风险因素。在这里,我们试图评估风险因素是否是结果的原因,并估计因果效应的大小。原则上,尽管随机试验是确定特定风险因素的因果状况的最佳方法,但它们有一些局限性,这里主要是因为随机试验既昂贵又费时,特别是在结局很少或需要长期随访的情况下。此外,在某些情况下,可能无法获得仅对目标危险因素有影响的靶向治疗。此外,由于实际或道德原因,许多风险因素不能随机分配。例如,在评估喝红酒对冠心病风险的影响时,招募参与者(例如20年)随机分配喝红酒或戒酒是不可行的。
另外,观察性研究的结果很容易被一些混杂因素干扰,导致其因果关系实际上并不成立。例如根据观察数据,激素疗法激素曾被认为对降低乳腺癌和心血管疾病的死亡率是有益的,但后来在随机试验中被证明会增加死亡率。因此,需要更强大的方法来使用观察数据评估因果关系,而孟德尔随机化就是这样一种方法。
1.2 遗传流行病学的兴起
遗传流行病学是主要研究遗传因素在人群健康和疾病中的作用。在这里,我将会和大家介绍遗传流行病学的历史和发展,并解释为什么它是流行病学和科学研究的重要领域。
1.2.1历史背景
尽管几千年以来一直观察到子代会继承父代的相关特征,但长期以来我们并不清楚其中遗传机理。当查尔斯·达尔文(Charles Darwin)在1859年提出其进化论时,其主要问题之一是缺乏遗传的基本机制。孟德尔(Gregor Mendel)在1866年提出了两个遗传法则:(1)随机分配;(2)自由组合。这些法则用术语“孟德尔遗传定律”来概括,这也正是孟德尔随机化的名字由来。
1.2.2遗传与疾病
随着人类基因组的发展,人们对疾病遗传因素的研究已从单基因疾病(由于镰刀状细胞贫血等单一突变基因导致的疾病)扩展到多基因和多因素疾病,其中负担重的疾病风险通常不是由单个基因决定,而是多个基因与生活方式和环境因素相互作用的结果。这些疾病,例如癌症、糖尿病和冠心病,倾向于在家庭中聚集,但也受到一些可改变的危险因素的影响,例如饮食和血压。大量研究已经发现了几种与这些疾病有关的遗传因素,特别是全基因组关联研究(GWAS)在通过测试数百万个遗传变异与疾病结果的关联,已经发现大量和人类疾病相关的遗传变异。在某些情况下,这些发现强化了人们对疾病机制的理解以及预测个体疾病风险的能力。不过,由于通常无法更改个人的基因组,因此从临床角度来看,它们受到的关注有限。然而,这些遗传变异却为孟德尔随机化提供了机会,因为孟德尔随机化正是利用遗传数据评估各种危险因素间因果关系的方法。
1.3 经典实例:炎症假说
“炎症假说”是理解心血管疾病的重要方面。炎症是人体对有害刺激的反应机制之一,它的特征是在受影响的身体部位发红,肿胀,发热,疼痛和功能丧失,一般可分为急性炎症和慢性炎症。心血管疾病是一个涵盖一系列疾病的术语,包括冠心病(尤其是心肌梗塞或“心脏病”)和中风,它是目前全球最大的死亡原因。炎症假说指出,炎症反应机制的某些方面会导致心血管疾病事件,干预该途径将降低心血管疾病的风险。
1.3.1 C反应蛋白与冠心病
作为发炎过程的一部分,人体会产生几种化学物质,称为急性期蛋白。这些代表了人体抵抗感染和伤害的第一道防线,其中特别令人关注的是C反应蛋白(C-Reactive Protein),以及CRP水平升高在冠心病(CHD)风险中的作用。众所周知,CRP与冠心病风险相关,但在孟德尔随机化研究之前,尚不清楚这种关联是否为因果关系。本例中拟解决的具体问题是:长期升高的CRP水平是否会导致更大的CHD风险。
1.3.2关联的替代解释
在疾病过程中,有许多因素会增加CRP水平和CHD风险,这些因素均被称为混杂因素,它们可以通过统计分析(例如多变量回归)手段进行衡量和解释。但是,现实问题是我们无法知道是否所有这些因素都已被发现。同样,CRP水平会随着对亚临床疾病的反应而增加,从而有可能观察到的关联是由于反向因果关系造成的。其中值得注意的混杂因素是纤维蛋白原,它一种可溶的血浆糖蛋白,能使血液凝结,同样也是炎症反应的一部分。尽管观察到CRP与冠心病风险呈正相关,但对各种常规风险因素(例如年龄,性别,体重指数和糖尿病状态)的调整矫正之后该关联度可降低,并在进一步矫正纤维蛋白原时接近零。评估CRP的升高是否与纤维蛋白原的变化有因果关系非常重要,因为如果两者之间存在因果关系,CRP对CHD的效应将会收到纤维蛋白原的影响,这会减弱真实的因果关系。
1.3.3工具变量
为了解决常规流行病学中混杂因素和反向因果关系的问题,我们引入了工具变量的概念。工具变量是可测量的数量(变量),它与我们感兴趣的风险因素相关,但与其他混杂因素不相关,并且它对结局的影响只能通过风险因素所实现。详细内容可以参考往期内容什么是工具变量?
1.3.4遗传变异作为工具变量
遗传变异是个体之间不同的遗传密码的一部分。在孟德尔随机化中,遗传变异被用作工具变量,那么人群中的个体可以根据其遗传变异分为不同的亚组。假设遗传变异在人群中“随机”分布,与环境和其它混杂因素无关,那么这些遗传亚组在环境和混杂因素上的水平应该没有差异。此外,由于每个人的遗传密码都是在出生前确定的,因此在成熟个体中测得的变量不可能是遗传变异的“原因”,这也将因果关系的方向确定下来了。现在回到我们的示例,如果我们可以找到与CRP水平相关的合适的遗传变异(或多个变异),那么我们可以将由CRP平均水平较低的个体组成的亚组与CRP平均水平较高的亚组进行比较。实际上,这就相当于我们正在人口中开展一项自然实验,通过自然实验,自然随机给予了某些个体遗传“治疗”以提高其CRP水平,如果携带相关遗传变异(与CRP水平升高且满足工具变量假设)的个体表现出较高的CHD发生率,那么我们可以得出结论,CRP是CHD的因果风险因素,而降低CRP可能会导致冠心病发病率降低,同时我们可以进一步估算出因果参数。尽管孟德尔随机化方法使用遗传变异来回答推论性问题,但这些并不是遗传学问题,而是流行病学的因果推断问题。
1.3.5违反工具变量假设
在实际研究中,仅凭观测数据是无法检验两个变量之间是否存在因果关系,因为它实际上并不满足工具变量假设。例如,如果孟德尔随机化分析中使用的与CRP水平相关的遗传变异也与血压独立相关,则遗传亚组的比较将不是CRP对冠心病风险的因果效应的有效检验,因为它受到了高血压等因素的干扰。工具变量假设的有效性对于孟德尔随机调查的解释至关重要,我们将会在后面详细和大家介绍。
1.3.6 CRP CHD遗传学合作
这里我们主要以CRP与冠心病风险和纤维蛋白原的因果关系为例,解释孟德尔随机化中使用的统计方法和问题。数据来自CRP CHD遗传合作组织(CCGC),该联盟由47项研究组成,包括队列研究,病例对照研究和嵌套病例对照研究。这些研究大多记录了有关CRP水平,CHD突发事件(或回顾或横断面研究中CHD事件的历史)以及多达20种与CRP水平相关的遗传变异的数据。在这些研究中,我们将集中研究四个遗传变异,它们主要位于1号染色体上CRP基因区域内或其周围。
好了,今天的内容就分享到这里,米老鼠会在接下来的时间持续更新孟德尔随机化研究的相关知识,敬请期待!
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!