表示两种情况下发病密度或者说发病概率之比 Pt:
实验组人群反应阳性概率 Pc:
对照组人群反应阳性概率
如果RR > 1,说明相应的自变量取值增加,会导致个体发病/死 亡风险增加若干倍,例如:吸烟者的发病概率是非吸烟者的5倍
RR在医学中得到了极为广泛的应用
RR的计算条件比较苛刻(观察周期长
为下列两种比例之比
反应阳性人群中实验因素有无的比例 a/b
反应阴性人群中实验因素有无的比例 c/d
例如:某疾病病例中吸烟/非吸烟者的比例是非病例中吸烟/非吸 烟者比例的3倍
OR可以间接反映关联强度,但是理解上比较困难
发病概率较低时,OR往往近似的在按照RR的含义进行解释和使 用
代码实现
scipy的实现方式
scipy.stats.fisher_exact()中可以计算OR值,相应的检验P值则 是确切概率法的P值
- OR, P = ss.fisher_exact(pd.crosstab(home.Ts9,
- home.O1))
statsmodels的实现方式
- import numpy as np
- import statsmodels.stats.contingency_tables as
- tbl
- # 这里必须使用np.array函数进行数组转换,否则后续计算会
- 出问题
- table =
- tbl.Table2x2(np.array(pd.crosstab(home.Ts9,
- home.O1)))
- print(table.oddsratio) # OR值
- print(table.summary()) # 汇总信息
基础告一段落 下一阶段 深度学习