医学统计学-卡方检验

1. 卡方分布当自由度趋于无穷大时,图形趋于正态分布 # 产生服从卡方分布的观测数为1000的样本 df_n <- seq (1 , 5 ) chisq_data <- function (n ){  x <- seq (- 0.2 , 16 , length = 300 )  prob &lt

1. 卡方分布

当自由度趋于无穷大时,图形趋于正态分布

 
 
 
 
 

  1. 定义为:若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于 标准正态分布),则这n个服从标准正态分布的随机变量的平方和服从卡方分布

  2. 可加性:两个服从卡方分布的独立随机变量相加服从自由度为两自由度之和的卡方分布

  3. 卡方检验的基本思想:由于在假设符合某种情况的前提下,样本实际值偏离理论值的偏差服从正态分布,其均值为理论值,方差也为理论值???(有点疑惑)

2. 四格表资料的卡方检验

书上P98例7-2:表格为

组别有效无效合计
胞磷胆碱组46652
神经节苷酯组18826
合计641478

H0:两种药物疗效相同 H1:有效率不等

 
 
 

得到warning "Chi-squared approximation may be incorrect" 因为表格中有T<5, 此时可以采用校正【自动校正】或者fisher.test() 可以用以下代码查看理论值

 
 
 

参考: http://r.789695.n4.nabble.com/In-chisq-test-x-Chi-squared-approximation-may-be-incorrect-td845040.html

3. 四格表资料的Fisher确切概率法

  • 超几何分布 从一个有限总体中进行不放回抽样,设N件产品,有M件不合格品,若从中不放回地随机抽取n件,则其中含有的不合格品件数X服从超几何分布,记为X~h(n, N, M)

  • P100 例7-4

    组别感染未感染合计
    预防组41822
    非预防组5611
    合计92433

假设两组(预防组和非预防组)的感染率都是9:33【零假设】,则边缘值固定的情况下,相当于在总数33的所有个体中【有9个感染的,24个未感染的】,取22个值作为有效组,在这22个值中,记感染的人数为X,则X~h(22, 9, 24)。 H0: 两个组无查别

 
 
 
 
 
 

4. 配对四格表的卡方检验

  • 在次处的配对即同一样本接受两种处理

  • 用结果不一致的两种情况计算统计量卡方(分b+c>=40和b+c<40的情况)

  • 称为McNemar卡方检验

 
 
 
 

参考: https://stat.ethz.ch/R-manual/R-devel/library/stats/html/mcnemar.test.html

5. 行*列资料的卡方检验

  • 多个样本率的比较(同四格表代码)

  • 样本构成比的比较(同四格表代码)

  • 双向无序分类变量的关联性检验方法1:

 

 
 
 

方法2:

 
 

参考: https://www.rdocumentation.org/packages/DescTools/versions/0.99.19/topics/Association%20measures

  • 双向有序分组变量的线性趋势检验

    • 线性趋势:对卡方进行分解,分解为回归分量卡方和偏离线性回归分量卡方

    • 相关关系:等级相关分析

    • 差别分析:视为单向有序的秩转换非参数检验(如不同年龄组的疗效差别)

  • 双向有序属性相同

    • 相当为配伍资料(不同检测方法,同一样本)

    • 一致性检验(Kappa检验)

    • 特殊模型分析

  • 单向有序

    • 分组为有序,指标为无序(卡方检验)

    • 分组为无序,指标为有序(秩转换非参数检验)

6. 多个样本率之间的多重比较

  • 卡方分割法

  • 多个实验组两两比较(alpha=alpha/(choose(2, k)+1))

  • 实验组与同一个对照组比较(alpha=alpha/(2*(k-1)))

7. 频数分布拟合度的卡方检验

  • 卡方=sum((理论频数-观察频数)^2/(理论频数))

  • 自由度=行数-(计算理论频数时使用的统计量个数如总例数或均数等)


持续更新......

       [科普]R语言生物信息大数据分析与深度挖掘

       [科普]Meta analysis教程


转自:麦豆科研技术毛毛
  • 发表于 2018-08-30 08:58
  • 阅读 ( 6715 )
  • 分类:编程语言

0 条评论

请先 登录 后评论
不写代码的码农
生信

2 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章