逻辑回归是基于概率分类的有监督学习算法,它依赖于直线方程,产生的模型非常容易解释和交流。在其最简单的形式中,逻辑回归被用来预测二分类问题,但算法的变体也可以处理多个类。
逻辑回归算法通常应用于二分类问题,称为二项逻辑回归 (binomial logistic regression),当处理三分类或更多分类问题时,称为多项逻辑回归 (multinomial logistic regression)。该算法的应用过程如 Fig 1 所示,其中虚线表示中间还有其他过程,稍后会有介绍。
在此,我们建立一个二项逻辑回归模型来预测一名乘客是否能在泰坦尼克号灾难中幸存下来。加载包:
library(mlr)
library(tidyverse)
注:R 中警告信息:自 2019 年 7 月以来,mlr 处于“仅维护”模式。未来的开发将只在 mlr3 中进行(https://mlr3.mlr-org.com)。由于对 mlr3 的关注,在 mlr 中可能会有未捕获的 bug,请考虑切换。
该数据集在 titanic 包中,有 891