生存分析——基本概念

文章对生存分析的概念以及特点进行初步介绍

生存分析(survival analysis)是对生存时间进行分析的统计技术总称。
既考虑结果又考虑生存时间的一种统计方法,并可充分利用截尾数据所提供的不完全信息,对生存时间的分布特征进行描述,对影响生存时间的主要因素进行分析。

生存分析的基本目的就是刻画生存时间的分布。

生存分析相较于其它多因素分析的主要区别点:生存分析考虑到了每个研究对象出现某一结局所经历的时间长短。


(一)基本概念:

1.起始事件(initial event):反应生存时间起始特征的事件,如疾病确诊、某种疾病治疗开始等。

2.失效事件(failure event):在生存分析随访研究过程中,一部分研究对象可观察到死亡,可以得到准确的生存时间,它提供的信息是完全的,这种事件称为失效事件,也称之为死亡事件、终点事件。

3.生存时间(survival time):从规定的观察起点到某一特定终点事件出现的时间长短。
     其中根据研究对象的结局,生存时间数据可分为两种类型:
             1)完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(complete data)。用符号“ t ”表示。

             2)删失数据(截尾数据):规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,               

                                                      如病人生存时间在未达到规定的终 点就被截尾一样,称为生存时间的删失数据,又称截尾数据,用符号“ t+ ”表示。

    产生删失数据的常见原因有:
            1)研究结束时终点事件尚未发生;
            2)失访;
            3)死于其它原因;
            4)由于严重药物反应而终止观察或改变治疗措施。

4.死亡概率(probability of death):表示某单位时段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。

attachments-2017-08-JonFZF1x59951dab615c

          注意:如果年内有删失,则分母用校正人口数(有效数目):
                                         校正人口数 = 年初人口数—删失例数/2

5.生存概率(probability of survival) :单位时段开始 时存活的个体,到该时段结束时仍然存活的可能性。(注意:若年内有删失,分母用校正人口数。)

attachments-2017-08-UFrrBwUw59951e1466b06.生存率(survival rate) :0 时刻存活的个体经历 tk时个单位时间段后仍存活的可能性。
           1)若资料中无删失数据时:

attachments-2017-08-l8gm9QEn59951e79af16

           2)若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:

attachments-2017-08-A0gqx9L159951ec41ecd


attachments-2017-08-91tG4rYm59951f0257e0
       故生存率又称为累积生存概率(cumulative probability of survival ),它是随着时间的变化而变化着的,是关于时间的函数,称为生存函数(survival  function)。  
             3)区分:生存率与生存概率
                         生存概率是针对单位时间而言的;
                         生存率是针对某个较长时段的,是生存概率的累计结果。

            4)生存率的标准误:attachments-2017-08-axn2JAIB59951fa96e28                其中:dj为第 j 个时间段内死亡人数;nj为第 j 个时间段期初人口数         

            5) 置信区间:attachments-2017-08-vEzI1Pbx5995221e232d 7.  中位生存期(median survival time) :也称半数生存期,是生存时间中位数(M/P50),表示恰有50%的个体存活的时间,即生存率为50%时对应的生存时间,是描述集中趋势     指标。其中,中位生存期越长,表示疾病的预后越好。     

8.生存期的四分位数间距: Q=P75-P25
   是反映离散程度大小的指标。 

9.风险函数(hazard function): t 时刻存活的个体在t 时刻的瞬时死亡率。

attachments-2017-08-tdpy3Zfi599522e2e529              h(t)近似地等于t 时刻存活的个体在此后一个单位时段内的死亡概率。
              若h(t)是一种上升曲线,表示危险率随时间变化而增加,如患有急性疾病患者治疗无效其危险率随时间呈现增加趋势;
              若h(t)是一种下降曲线,表示危险率随时间变化而减少;
              若h(t)是一种稳定的危险率函数,则表示患者在稳定期,危险率基本不变。

10.生存曲线:以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。
     生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短生存期。

attachments-2017-08-8zrGkHoF599525b36d00

(二)生存分析的特点:

1.生存资料特点:
         1) 有结局和生存时间两个因变量;
         2)生存时间分布不正态—非负且右偏;
         3)可能含有删失数据(censor)

2.生存分析特点:
        1)同时考虑结局和生存时间两个因变量;  
        2)可处理生存时间分布不正态的问题;
        3)可处理删失数据。

3.处理删失/截尾数据时两种错误的做法:
    错误1:只考虑确切数据,丢弃截尾数据(损失信息);
    错误2:将截尾数据当作确切数据处理(低估了生存时间的平均水平)。

4.在处理正偏态分布数据时两种错误的做法:
    错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。
    错误2:采用常规 t 检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间 )


(三)绘制生存曲线方法:

1.大样本资料的生存分析方法—寿命表法(Life-table method)
2.小样本资料的生存分析方法:kaplan-meier法或称乘积极限法(product limit method)
并根据绘制出的生存曲线进行分析:Cox比例风险回归模型
常用工具:SPSS 、 R语言 、 SAS等
(生存曲线绘制分析以及软件应用随后会有相应介绍)

  • 发表于 2017-08-17 13:13
  • 阅读 ( 18577 )
  • 分类:方案研究

0 条评论

请先 登录 后评论
不写代码的码农
爽儿

学生

25 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章