生存分析——SPSS

应用SPSS软件对已有数据进行生存分析

应用SPSS软件对已有数据进行生存分析

常见方法有寿命表法、Kaplan-Meier分析法、Cox回归分析


一、寿命表分析

适用于大数据

示例:
若要研究性别对于肺病生存率有无区别,收集数据下列信息
time:生存时间(单位天)
status:0=存活,1=死亡
sex:1=男,2=女

操作步骤
按步骤将数据导入(lung数据集来自于R内置数据)

attachments-2017-08-JwYlELBb599a5b44aed2
选定寿命表分析方法

attachments-2017-08-q3lhFd1S599a5b5dd123

对各选项进行设置(其中注意状态设置:选取表示事件已发生的值)

attachments-2017-08-KKNJewgh599a5c1ba5c7

attachments-2017-08-FcViTwmo599a5c2b9e64

设置完所有选项后确认


得到结果(可进行导出)
1.得到存活表:该表给出了男女对应时间内存活和死亡人数,并计算了存活率、风险比等统计量

attachments-2017-08-OlaIEnI8599a5c8e8cf7

2.中位数生存时间:即生存率为50%时,生存时间的平均水平;
可知:生存时间的平均水平女士高于男士
attachments-2017-08-0zdTRp5Y599a5c9b4980
3.生存函数:男士较女士累计生存率下降快

attachments-2017-08-bwjrhuIj599a5caa0821


二、Kaplan-Meier分析

适用于小样本
示例:
若要研究药物治疗对卵巢癌生存率有无区别,收集数据下列信息
futime:生存时间(单位天)
fustat:0=存活,1=死亡
rx:1=未治疗,2=治疗

操作步骤:
按步骤将数据导入(ovarian数据集来自于R内置数据)

attachments-2017-08-hDBueMZG599a5db720ad
选定Kaplan-Meier分析法,并对选项进行设置

attachments-2017-08-ejqe31i7599a5dd916d8attachments-2017-08-oflJblIv599a5ddd2433attachments-2017-08-IwsiRo9B599a5dcede6c

设置结束后确认


得到结果(可进行导出):
1.生存表的均值和中位数、百分位数:可以看出治疗与未治疗有均值、四分位数略有差异

attachments-2017-08-H94b9ZZG599a5e9453e5
2.整体比较:检验结果p值>0.05,证明治疗组与非治疗组差异不显著

attachments-2017-08-om23jBoB599a5e9c0cc3
3.存活函数:治疗组较非治疗组生存结果好,但从假设检验结果来看差异不明显

attachments-2017-08-kN1peiE7599a5ea48681


三、Cox回归分析

示例:
若要研究结肠癌治疗方式对患者生存时间的影响,收集了下面所示的数据:
time:生存时间(单位天)
status:0=存活,1=死亡
rx:治疗方式,Obs=观察,Lev=方式1,Lev+5FU=方式2
obstruct:0=无阻塞的结肠肿瘤,1=有阻塞的结肠肿瘤
perfor:0=无结肠穿孔,1=有结肠穿孔
extent:传播程度:1 =黏膜下层,2 =肌肉,3 =浆膜,4 =相邻结构

操作步骤:
导入结肠癌colon数据(R中内置数据)

attachments-2017-08-YU900ySB599a7daa3540
选定cox回归分析
参数设置:
协变量依次导入,方法按分析所需进行选择

attachments-2017-08-venuKbSR599a7dd2da48
点击"分类",协变量依次选入分类协变量

attachments-2017-08-dQq5WXel599a7ddf2a9e
点击"绘图",勾选生存函数,主要变量为rx,将rx变量选入单线框中,绘制生存曲线

attachments-2017-08-ewFX3NI3599a7de67dba
点击"选项",设置输出RR的95%置信区间。

attachments-2017-08-U3tLwH1b599a7df02e93
最后确定

得到结果(可导出)
1.案例处理摘要:1858个样本,其中920个死亡,938个存活,无缺失值存在

attachments-2017-08-pO7o45x0599a7ec26914
2.分类变量编码:分类变量编码方式及频数

attachments-2017-08-ZJapEc5J599a7ecaecc2
3.拟合模型检验:原假设是“所有影响因素的偏回归系数均为0”,这里可以看出P<0.05拒绝原假设,认为有偏回归系数不为零的因素,值得进一步分析。

attachments-2017-08-thxyFflD599a7ed5db94
4.方程式中变量:多元回归结果,第二列B为偏回归系数,最后三列为OR值及其置信区间。

attachments-2017-08-hQiRrzl8599a7edfd1d6
5.协变量均值处的生存函数:总体的生存函数。患者生存率下降较快

attachments-2017-08-iJkFHQ1I599a7eea7bfd
6.生存函数:在控制了其他变量后,有无治疗的生存函数对比,可以直观看出,接受Lev+5FU治疗的患者的生存情况优于未接受治疗Obs和接受治疗Lev的患者。

attachments-2017-08-28r89ejQ599a7ef40665



  • 发表于 2017-08-21 12:20
  • 阅读 ( 10758 )
  • 分类:方案研究

1 条评论

请先 登录 后评论
不写代码的码农
爽儿

学生

25 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章