小屌丝:鱼哥,鱼哥,求助
小鱼:咋了。
小屌丝:我被逻辑回归难住了。
小鱼:然后你可以网上搜索一下
小屌丝:搜索的没有问你直接啊
小鱼:我…xxx
小屌丝:给我讲一讲呗。
小鱼:ε=(´ο`*)))唉… 好吧,正好现在也没啥事。
逻辑回归是一种基于概率的分类算法,用于预测二分类问题。它采用逻辑函数将线性回归模型的输出映射到0和1之间的概率值。
逻辑回归通过将线性回归的输出值通过逻辑函数(也称为sigmoid函数)进行映射,将连续的预测值转换为概率值。逻辑函数的公式如下:
sigmoid(x) = 1 / (1 + e^(-x))
逻辑回归的模型可以用以下公式表示:
h(x) = sigmoid(W^T * X)
其中,h(x)表示预测概率值,W表示权重向量,X表示输入特征向量。我们需要通过训练过程来学习最佳的权重向量W。
这里 Sigmoid函数转换
Sigmoid函数是一种常用的非线性函数,其转换作用是将输入映射到一个范围在0到1之间的值。Sigmoid函数的表达式为:
y = 1 / (1 + e^(-x))
其中,e是自然常数,x是输入数据,y是输出数据。
# -*- coding:utf-8 -*-
# @Time : 2024-02-25
# @Author : Carl_DJ
'''
实现功能:
生成分类数据集
'''
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
# 生成分类数据集
X, y = make_classification(n_samples=1000, n_features=2, n_informative=2, n_redundant=0,
n_clusters_per_class=1, random_state=42)
# 创建逻辑回归分类器
logreg = LogisticRegression()
# 使用数据集训练模型
logreg.fit(X, y)
# 绘制数据点和决策边界
plt.figure(figsize=(8, 6))
plt.scatter(X[:, 0], X[:, 1], c=y, cmap='bwr', alpha=0.5)
# 生成网格点来绘制决策边界
h = 0.02 # 步长
x_min, x_max = X[:, 0].min() - 0.5, X[:, 0].max() + 0.5
y_min, y_max = X[:, 1].min() - 0.5, X[:, 1].max() + 0.5
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
Z = logreg.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
# 绘制决策边界
plt.contourf(xx, yy, Z, alpha=0.3, cmap='bwr')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.title('Logistic Regression Decision Boundary')
plt.colorbar()
plt.show()
运行结果
逻辑回归模型可以根据训练集中的数据学习到一组最佳的参数,从而能够根据输入特征进行准确的二分类预测。通过调整阈值,可以灵活地控制分类结果的精度和召回率。
学习逻辑回归的关键在于理解线性组合、sigmoid函数和概率解释的概念。
通过应用这些基本原理,结合实际数据集和示例代码的演示,希望你能对逻辑回归算法有一个清晰的认识,并能够在实际问题中应用它。
关于逻辑回归,也可以参照小鱼的这两篇博文:
我是小鱼:
关注小鱼,学习机器学习领域的知识。