生存分析涉及预测特定事件将发生的时间。它也被称为失效时间分析或死亡时间分析。例如,预测癌症患者的生存天数或预测机械系统失效的时间。
名为survival的R包用于进行生存分析。这个包包含函数Surv(),它将输入数据作为 R 公式,并在所选变量中创建一个生存对象以进行分析。然后我们使用函数survfit()来创建分析图。
安装包
install.packages("survival")
法
在 R 中创建生存分析的基本语法是 -
Surv(time,event)
survfit(formula)
以下是所用参数的描述 -
time是事件发生之前的后续时间。
event指示预期事件的发生状态。
公式是预测变量之间的关系。
例子
我们将考虑上面安装的生存包中存在的名为“pbc”的数据集。它描述了原发性胆汁性肝硬化 (PBC) 患者的生存数据点。在数据集中存在的许多列中,我们主要关注“时间”和“状态”字段。时间表示患者登记与患者接受肝移植或患者死亡之间的事件早期之间的天数。