Logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。
Logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释,实际中最为常用的就是二分类的logistic回归。
用心脏病判断数据为例,最后一列target为判断结果,即因变量(0-1变量),当target为0时,判定未患心脏病,当target为1时,判断为心脏病。通过前面一系列的年龄、性别等指标作为自变量进行判定。数据来源于参考链接[1]。数据形式如下:
上图为sigmoid函数表达式,可见当范围为0-1,当X<0时,Y趋向于0,X>0时,Y趋向于1,适合用于