分类和回归-支持向量机SVM算法

文章目录

简介
原理
多分类问题
回归问题
应用示例

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。

简介

支持向量机（Support Vector Machine, SVM）对监督学习下二分类问题提供了一个绝妙的解决方案。通过对偶函数和核函数求解，将适用范围从二维线性推广到多维非线性模型，使用相关方法变形，也可用于多分类问题和回归问题。

支持向量机SVM是方法统称，如果应用于分类Classification，也叫支持向量分类SVC；如果应用于回归Regression，也叫支持向量回归SVR。

原理

硬间隔

首先考虑如何评估分类模型的好坏？

在这里插入图片描述

在上图中，红点和蓝叉分别表示两类线性可分的数据（取自鸢尾花数据集）。有黑色、橙色和绿色三个线性模型，都可以将数据分为两类。

直观来说，一般我们会认为黑色表示的分类模型会更好。在SVM中，是因为黑色的间隔最大。所谓的「间隔」，直白的说，就是向垂直方向两边平移，直到遇到数据点，所形成的间隔。

间隔示意图如下所示：

在这里插入图片描述

而SVM中认为最佳的模型，就是可以取到最大间隔 $d$ 的中间那条直线，也就是到两边各是 $\frac{d}{2}$ ，这样就在最大间隔中若干平行线里，唯一确定了最优的线。

如此一来，由于黑色的间隔最大，所以认为优于橙色和绿色所表示的模型。

支持向量

可以看出，在确定最大间隔时，只与少量样本数据有关，平移过程中遇到数据点即停止。我们称这部分样本数据为支持向量，也就是支持向量机名字的由来。这也是支持向量机的一大优势——适用于小样本情况。

以上是二维特征便于可视化的情况。对于二维，我们可以用线来划分；对于三维，我们可以用平面来划分；对于多维，我们称之为超平面，使用超平面来划分。
用如下方程表示超平面：
$\bold w^T\bold x +b =0$
$\bold w$ 和 $\bold x$ 是向量，分别表示权重和特征。

对于二分类任务中，当y=+1是表示正例，y=-1表示负例。也就是y=+1时， $\bold w^T\bold x +b \geq 0$ ，令：
${\boldwT\boldxi+b≥+1,yi=+1\boldwT\boldxi+b≤−1,yi=−1$

{\boldwT\boldxi+b≥+1,\boldwT\boldxi+b≤−1,yi=+1yi=−1

{w^{T} x_{i} + b \geq + 1, w^{T} x_{i} + b \leq - 1, y_{i} = + 1 y_{i} = - 1

也就是说，上图中三条平行线的表达式分别是 $\bold w^T\bold x+b=+1$ 、 $\bold w^T\bold x+b=0$ 、 $\bold w^T\bold x+b=-1$ 。

再由点到平面距离公式 $r=\frac{|\bold w^T \bold x+b|}{||\bold w||}$ ，得到间隔（两个异类支持向量到超平面距离）定义：
$\gamma=\frac{2}{||\bold w||}$

为了求最大间隔，需要分式中分母最小，即最小化 $\bold ||w||^{-1}$ ，等价于最小化 $\frac{1}{2}||\bold w||^2$ 。

如此一来，对于线性模型，我们求解如下表达式即可求得最大间隔，也称支持向量机的基本型：
$\mathop{min}\limits_{\bold w,b}\quad\frac{1}{2}||\bold w||^2 \\ s.t.\quad y_i(\bold w^T\bold x_i+b)\geq1$

属于二次规划问题，即目标函数二次项，限制条件一次项。使用拉格朗日乘子法可求得其对偶问题，使用对偶问题优化目标函数和限制条件，方便进行求解。

对偶问题

对偶问题（dual problem）简单来说就是同一问题的不同角度解法。比如时间=路程÷速度，那么求最短的时间等价于求最大的速度。

对偶问题定义 $L(w,\alpha,\beta)=f(w)+\alpha^Tg(w)+\beta^T(w)$
若 $w^*$ 是原问题的解， $\alpha^*$ 和 $\beta^*$ 是对偶问题的解，则有 $f(w^*)\geq\theta(\alpha^*,\beta^*)$

对约束添加拉格朗日乘子 $\alpha_i\geq0$ ， $\alpha_i=(\alpha_1,\alpha_2,\dots,\alpha_m)$
定义凸二次规划拉格朗日函数： $L(\bold w,b,\alpha)=\frac{1}{2}||\bold w||^2+\sum_{i=1}^m\alpha_i(1-y_i(\bold w^T\bold x_i+b))$

定义原问题与对偶问题的间距 $G$ ， $G=f(w^*)-\theta(\alpha^*,\beta^*)\geq0$
强对偶定理：若 $f (w)$ 为凸函数，且 $g (w) = A w + b$ ， $h (w) = C w + d$ ，则此优化问题的原问题与对偶问题的间距为0。

通过强对偶性，转换为：
$\mathop{max}\limits_{\alpha} \mathop{min}\limits_{\bold w,b}L(\bold w,b,\alpha)$

对 $\bold w$ 和 $b$ 求偏导，即令 $\frac{\partial L}{\partial w}=0$ 和 $\frac{\partial L}{\partial b}=0$ ，有 $\sum_{i=1}^m\alpha_iy_i\bold x_i=\bold w\\ \sum_{i=1}^m\alpha_iy_i=0$

代回 $L(\bold w,b,\alpha)$ 中，一通消消乐后得到 $L(\bold w,b,\alpha)=\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_j\bold x^T_i\bold x_j$

也就是将求最小的 $\bold w$ 和 $b$ 转换为求最大的 $\alpha$ ，即对偶问题： $KaTeX parse error: No such environment: align* at position 148: ….t.\quad \begin{̲a̲l̲i̲g̲n̲*̲}̲\begin{split} \…$

同时满足约束和KKT条件：
$s.t.\quad {\boldαi≥0yif(\boldxi)−1≥0αi(yif(\boldxi)−1)=0$

⎧⎩⎨\boldαi≥0yif(\boldxi)−1≥0αi(yif(\boldxi)−1)=0

s . t . ⎩ ⎪ ⎨ ⎪ ⎧ α_{i} \geq 0 y_{i} f (x_{i}) - 1 \geq 0 α_{i} (y_{i} f (x_{i}) - 1) = 0

KKT条件： $\forall i=1\sim k,\alpha_i^*=0或g_i^*(w^*)=0$

也就是说：
若 $\alpha_i=0$ ，则全部乘起来为0， $f (x)$ 该项累加0，即该样本无影响。
若 $\alpha_i>0$ ，由KKT条件则 $y_if(\bold x_i)=1$ ，该样本位于最大间隔边界上，是一个支持向量。
再次说明SVM仅与支持向量有关，与大部分训练样本无关，适用于小样本数据集。

软间隔

前面假设的都是硬间隔的情况，也就是所有样本严格满足约束，不存在任何错误样本。而软间隔则是允许一定误差，不是非要全部样本都满足约束，允许一些样本“出错”。图摘自网络。

在这里插入图片描述

引用松弛变量 $\xi_i\geq0$ ，添加一个正则化项，将SVM的基本型改写为：
$\mathop{min}\limits_{\bold w,b,\xi_i}\quad\frac{1}{2}||\bold w||^2+C\sum_{i=1}^m\xi_i\\ s.t.\quad y_i(\bold w^T\bold x_i+b)\geq1-\xi_i$

$C$ 是常数，也就是说原来需要大于等于1才能判为正例，现在只需大于等于 $(1-\xi_i)$ 即可。但 $\xi_i$ 也不能太大，否则限制条件太容易成立，根本起不到限制作用，导致分类效果差。

同样的，将基本型转为对偶问题，添加拉格朗日乘子，并将偏导为0代回原式，得：
$\mathop{max}\limits_\alpha\quad\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_j\bold x_i^T\bold x_j\\s.t.\quad {0≤αi≤C∑mi=1αiyi=0$

{0 \leq α i \leq C \sum m i = 1 α i y i = 0

α ma x i = 1 \sum m α_{i} - \frac{1}{2} i = 1 \sum m j = 1 \sum m α_{i} α_{j} y_{i} y_{j} x_{i}^{T} x_{j} s . t . {0 \leq α_{i} \leq C \sum_{i = 1}^{m} α_{i} y_{i} = 0

其实，与硬间隔的区别就只是限制条件不同了，硬间隔 $0\leq\alpha_i$ 即可，软间隔 $0\leq\alpha_i\leq C$ 。

兼容软间隔的情况，使模型具有一定容错能力。

核函数

我们再考虑下非线性模型，因为线性模型可以看成非线性模型的一种情况，得到非线性模型的表达式后，可以统一求解。

线性可分，是可以用一条直线进行区分；线性不可分，就是不能用一条直线区分，需要用曲线区分。而非线性模型，就是对于线性不可分的情况，如异或问题（图摘自网络）：
在这里插入图片描述

对于这样的问题，我们可以将原本特征空间映射到一个更高维度的空间，使得在这个高纬度空间中存在超平面将样本分离，即是线性可分的。也就是升维，这个维度可以是无穷维的，一定可以使其线性可分的，只是我们难以想象。
$f(\bold x)=\bold w^T \phi(\bold x)+b$

升维后：
$\mathop{max}\limits_\alpha\quad\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_j\phi(\bold x_i)^T\phi(\bold x_j)$

但是新的问题是，我们不知道这个无限维映射 $\phi(x)$ 的显示表达，即无法直接计算内积 $\phi(\bold x_i)^T\phi(\bold x_j)$ ，此时需要用到核函数（Kernel Function）：
$\Kappa(\bold x_i,\bold x_j)=\phi(\bold x_i)^T\phi(x_j)$

通过核函数在原始样本空间计算的结果，等于升维后特征空间的内积，代回原表达式，得：
$\mathop{max}\limits_\alpha\quad\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_j\Kappa(\bold x_i,\bold x_j)\\s.t.\quad {0≤αi≤C∑mi=1αiyi=0$

{0 \leq α i \leq C \sum m i = 1 α i y i = 0

α ma x i = 1 \sum m α_{i} - \frac{1}{2} i = 1 \sum m j = 1 \sum m α_{i} α_{j} y_{i} y_{j} K (x_{i}, x_{j}) s . t . {0 \leq α_{i} \leq C \sum_{i = 1}^{m} α_{i} y_{i} = 0

即
${f(x)=\boldwTϕ(\boldx)+b=∑mi=1αiyiϕ(\boldxi)+b=∑mi=1αiyi\Kappa(\boldxi,\boldxj)+b$

⎧⎩⎨⎪⎪f(x)=\boldwTϕ(\boldx)+b=∑mi=1αiyiϕ(\boldxi)+b=∑mi=1αiyi\Kappa(\boldxi,\boldxj)+b

⎩ ⎪ ⎨ ⎪ ⎧ f (x) = w^{T} ϕ (x) + b = \sum_{i = 1}^{m} α_{i} y_{i} ϕ (x_{i}) + b = \sum_{i = 1}^{m} α_{i} y_{i} K (x_{i}, x_{j}) + b

常用核函数：

名称	表达式
线性核	$\kappa(\bold x_i,\bold x_j)=exp(\bold x_i^T\bold x_j)$
多项式核	$\kappa(\bold x_i,\bold x_j)=exp(\bold x_i^T\bold x_j)^d$
高斯核	$\kappa(\bold x_i,\bold x_j)=exp(\frac{\|\|\bold x_i-\bold x_j\|\|^2}{2\sigma^2})$

多项式核中 $d$ 表示多项式次数，可以调参。
高斯核也需要调参 $\sigma>0$ ，表示高斯核的带宽。

核函数就是为了兼容非线性模型，升维后并求解。

SMO算法

求解：
$\mathop{max}\limits_\alpha\quad\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jK(\bold x_i,\bold x_j)\\s.t.\quad {0≤αi≤C∑mi=1αiyi=0$

{0 \leq α i \leq C \sum m i = 1 α i y i = 0

α ma x i = 1 \sum m α_{i} - \frac{1}{2} i = 1 \sum m j = 1 \sum m α_{i} α_{j} y_{i} y_{j} K (x_{i}, x_{j}) s . t . {0 \leq α_{i} \leq C \sum_{i = 1}^{m} α_{i} y_{i} = 0

用SMO（Sequential Minimal Optimization）算法求解这个二次规划问题。

思路是先固定 $\alpha_i$ 之外的所有参数，然后求 $\alpha_i$ 上的极值。由于存在约束 $\sum_{i=1}^m\alpha_iy_i=0$ ，固定其他变量之后，便可求出 $\alpha_i$ 。于是每次选择两个变量 $\alpha_i$ 和 $\alpha_j$ 并固定其他参数，直至收敛。

仅考虑 $\alpha_i$ 和 $\alpha_j$ （ $\alpha_i\geq0,\alpha_j\geq0$ ）：
$\alpha_iy_i+\alpha_jy_j=c$

$c$ 是使 $\sum_{i=1}^m$ 成立的常数， $c=-\sum_{k\neq i,j}\alpha_ky_k$
如此便可计算 $\alpha_i$ 和 $\alpha_j$ 。

再代入任何一个支持向量 $y_sf(\bold x_s)=1$ ，便可求得 $b$ ：
$y_s(\sum_{i\in S}\alpha_iy_i\bold x_i^T\bold x_s+b)=1$

也可以带入全部的支持向量，然后取平均值。

（~~插播反爬信息~~ ）博主CSDN地址：https://wzlodq.blog.csdn.net/

小结

训练流程
输入样本{ $\bold x_i, y_i$ }，i:1~m
最大化间隔：
$\mathop{max}\limits_\alpha\quad\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jK(\bold x_i,\bold x_j)\\s.t.\quad {0≤αi≤C∑mi=1αiyi=0$
${0 \leq α i \leq C \sum m i = 1 α i y i = 0$ $α ma x i = 1 \sum m α_{i} - \frac{1}{2} i = 1 \sum m j = 1 \sum m α_{i} α_{j} y_{i} y_{j} K (x_{i}, x_{j}) s . t . {0 \leq α_{i} \leq C \sum_{i = 1}^{m} α_{i} y_{i} = 0$
在[0,C]中，找一个 $\alpha_i$ ，算b：
$b=\frac{1-y_i\sum_{j=1}^n\alpha_jy_jK(\bold x_i,\bold x_j)}{y_i}$
测试流程
输入测试样本 $\bold x$
若 $\sum_{i=1}^n\alpha_iy_iK(\bold x_i,\bold x)+b\geq0$ ，则y=+1
若 $\sum_{i=1}^n\alpha_iy_iK(\bold x_i,\bold x)+b<0$ ，则y=-1

多分类问题

如上SVM可以解决二分类问题，但是并不能直接解决多分类问题，不过也是可以在逻辑上进行求解，但是开销较大，需要构建多个SVM。

如三分类问题，有A、B、C三类，此时可以构建3个SVM。
比如：
SVM1：A vs B
SVM2：A vs C
SVM3：B vs C

如果SVM1=+1且SVM2=+1，SVM3无所谓，则分类为A。
如果SVM1=-1且SVM2=-1且SVM3=+1，则分类为B。
如果SVM1=-1且SVM2=-1且SVM3=-1，则分类为B。

再比如合并数据集：
SVM1：A vs BC
SVM2：B vs AC
SVM3：C vs AB

如果SVM1=+1或（SVM2=-1且SVM3=-1），则分类为A。
如果SVM2=+1或（SVM1=-1且SVM3=-1），则分类为B。
如果SVM3=+1或（SVM1=-1且SVM2=-1），则分类为C。

但如果出现SVM1=SVM2=SVM3=+1的情况，虽然逻辑上都是+1，没有满足条件的解，但其实我们是算出了具体的值 $\bold w^T\bold x+b$ ，其大于等于+1，则置y=+1。此时我们可以用这个具体的值来判断，而不是用y，比较SVM123算出来的具体值 $\bold w^T\bold x+b$ ，判为值最大的SVM对应类。

N分类以此类推，需要构建N个支持向量机。

回归问题

原理与求解步骤与分类时基本一致，在分类中添加了一个松弛变量，允许一定误差，满足软间隔。同样的在回归中，也添加了一个偏差 $\epsilon$ ，构建了一个宽度为 $2\epsilon$ 的误差间隔带，只要落入此间隔带内，则认为是被预测正确的。也就是两个松弛变量 $\xi$ 和 $\hat{\xi}$ ,，分别表示两侧的松弛程度。图摘自网络。
在这里插入图片描述
即：
$\mathop{min}\limits_{\bold w,b,\xi,\hat{\xi}}\quad \frac{1}{2}||\bold w||^2+C\sum_{i=1}^m(\xi_i+\hat{\xi_i})\\\\s.t.\quad {f(\boldxi)−yi≤ϵ+ξiyi−f(\boldxi)≤ϵ+^ξiξi≥0,^ξi≥0$

⎧⎩⎨⎪⎪f(\boldxi)−yi≤ϵ+ξiyi−f(\boldxi)≤ϵ+ξi^ξi≥0,ξi^≥0

w, b, ξ, \hat{ξ} min \frac{1}{2} ∣ ∣ w ∣ ∣^{2} + C i = 1 \sum m (ξ_{i} + \hat{ξ_{i}}) s . t . ⎩ ⎪ ⎨ ⎪ ⎧ f (x_{i}) - y_{i} \leq ϵ + ξ_{i} y_{i} - f (x_{i}) \leq ϵ + \hat{ξ_{i}} ξ_{i} \geq 0, \hat{ξ_{i}} \geq 0

同样转换对偶问题，映射高维度并用核函数求解，得到回归方程：
$f(\bold x)=\sum^m_{i=1}(\hat{\alpha_i}-\alpha_i)\Kappa(\bold x,\bold x_i)+b$

应用示例

sklearn对支持向量机封装了很多模型，相关函数调用可以查询文档。

例1. 线性核

import numpy as np
from matplotlib import pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import LinearSVC
from matplotlib.colors import ListedColormap
from sklearn.metrics import classification_report


def plot_boundary(model, axis):
    x0, x1 = np.meshgrid(
        np.linspace(axis[0], axis[1], int((axis[1] - axis[0]) * 100)).reshape(-1, 1),
        np.linspace(axis[2], axis[3], int((axis[3] - axis[2]) * 100)).reshape(-1, 1),
    )
    X_new = np.c_[x0.ravel(), x1.ravel()]  # 变成二维矩阵

    y_predict = model.predict(X_new)  # 二维点集才可以用来预测
    zz = y_predict.reshape(x0.shape)

    custom_cmap = ListedColormap(['#EF9A9A', 'black', '#90CAF9'])
    plt.contourf(x0, x1, zz, cmap=custom_cmap)

    w = model.coef_[0]
    b = model.intercept_[0]

    index_x = np.linspace(axis[0], axis[1], 100)

    y_up = (1 - w[0] * index_x - b) / w[1]  # w1x1+w2x2+b=-1
    x_index_up = index_x[(y_up >= axis[2]) & (y_up <= axis[3])]
    y_up = y_up[(y_up >= axis[2]) & (y_up <= axis[3])]

    y_down = (-1 - w[0] * index_x - b) / w[1]  # w1x1+w2x2+b=1
    x_index_down = index_x[(y_down >= axis[2]) & (y_down <= axis[3])]
    y_down = y_down[(y_down >= axis[2]) & (y_down <= axis[3])]

    y_origin = (- w[0] * index_x - b) / w[1]  # w1x1+w2x2+b=0
    x_index_origin = index_x[(y_origin >= axis[2]) & (y_origin <= axis[3])]
    y_origin = y_origin[(y_origin >= axis[2]) & (y_origin <= axis[3])]

    plt.plot(x_index_origin, y_origin, color="black")
    # plt.plot(x_index_up, y_up, color="black")
    # plt.plot(x_index_down, y_down, color="black")

    # plt.plot([2.5,2.5],[0,1.9],color="orange")
    # plt.plot([0.9, 5.2], [0.75, 0.75], color="green")


iris = datasets.load_iris()  # 鸢尾花数据集
x = iris.data[:100, [2, 3]]  # 取前100行（二分类，取第2、3列特征
y = iris.target[0:100]

x_train, x_test, y_train, y_test = train_test_split(x, y)  # 划分训练集测试集

linearsvc = LinearSVC(C=1e9)  # 创建模型
linearsvc.fit(x_train, y_train)  # 训练
y_pred = linearsvc.predict(x_test)  # 测试
print('w：', linearsvc.coef_)
print('b：', linearsvc.intercept_)
print(classification_report(y_test, y_pred))  # 评估
# 可视化
plot_boundary(linearsvc, axis=[0.9, 5.2, 0, 1.9])
for i in range(50):
    plt.scatter(x[i][0], x[i][1], color="red", marker='o')
for i in range(50, 100):
    plt.scatter(x[i][0], x[i][1], color="blue", marker='x')

plt.show()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67

在这里插入图片描述

例2. 多项式核

import numpy as np
from matplotlib import pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from matplotlib.colors import ListedColormap
from sklearn.metrics import classification_report


def plot_boundary(model, axis):
    x0, x1 = np.meshgrid(
        np.linspace(axis[0], axis[1], int((axis[1] - axis[0]) * 100)).reshape(-1, 1),
        np.linspace(axis[2], axis[3], int((axis[3] - axis[2]) * 100)).reshape(-1, 1),
    )
    X_new = np.c_[x0.ravel(), x1.ravel()]  # 变成二维矩阵

    y_predict = model.predict(X_new)  # 二维点集才可以用来预测
    zz = y_predict.reshape(x0.shape)

    custom_cmap = ListedColormap(['#EF9A9A', 'black', '#90CAF9'])
    plt.contourf(x0, x1, zz, cmap=custom_cmap)


moons = datasets.make_moons(noise=0.1, random_state=20221017)  # 创建数据
x = moons[0]
y = moons[1]
x_train, x_test, y_train, y_test = train_test_split(x, y)  # 划分训练集测试集
poly_svc = SVC(kernel='poly', degree=5)  # 多项式核
poly_svc.fit(x, y)  # 训练
y_pred = poly_svc.predict(x_test)  # 测试
print(classification_report(y_test, y_pred))  # 评估
plot_boundary(poly_svc, axis=[-1.2, 2.2, -0.75, 1.25])
plt.scatter(x[y == 0, 0], x[y == 0, 1], color='red')
plt.scatter(x[y == 1, 0], x[y == 1, 1], color='blue')
plt.show()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

在这里插入图片描述

例3. 高斯核

import numpy as np
from matplotlib import pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from matplotlib.colors import ListedColormap
from sklearn.metrics import classification_report


def plot_boundary(model, axis):
    x0, x1 = np.meshgrid(
        np.linspace(axis[0], axis[1], int((axis[1] - axis[0]) * 100)).reshape(-1, 1),
        np.linspace(axis[2], axis[3], int((axis[3] - axis[2]) * 100)).reshape(-1, 1),
    )
    X_new = np.c_[x0.ravel(), x1.ravel()]  # 变成二维矩阵

    y_predict = model.predict(X_new)  # 二维点集才可以用来预测
    zz = y_predict.reshape(x0.shape)

    custom_cmap = ListedColormap(['#EF9A9A', 'black', '#90CAF9'])
    plt.contourf(x0, x1, zz, cmap=custom_cmap)


moons = datasets.make_moons(noise=0.1, random_state=20221017)  # 创建数据
x = moons[0]
y = moons[1]
x_train, x_test, y_train, y_test = train_test_split(x, y)  # 划分训练集测试集
poly_svc = SVC(kernel='rbf')  # 高斯核
poly_svc.fit(x, y)  # 训练
y_pred = poly_svc.predict(x_test)  # 测试
print(classification_report(y_test, y_pred))  # 评估
plot_boundary(poly_svc, axis=[-1.2, 2.2, -0.75, 1.25])
plt.scatter(x[y == 0, 0], x[y == 0, 1], color='red')
plt.scatter(x[y == 1, 0], x[y == 1, 1], color='blue')
plt.show()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

在这里插入图片描述

例4. 回归

import numpy as np
from matplotlib import pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC, SVR
from matplotlib.colors import ListedColormap
from sklearn.metrics import classification_report


def plot_boundary(model, axis):
    x0, x1 = np.meshgrid(
        np.linspace(axis[0], axis[1], int((axis[1] - axis[0]) * 100)).reshape(-1, 1),
        np.linspace(axis[2], axis[3], int((axis[3] - axis[2]) * 100)).reshape(-1, 1),
    )
    X_new = np.c_[x0.ravel(), x1.ravel()]  # 变成二维矩阵

    y_predict = model.predict(X_new)  # 二维点集才可以用来预测
    zz = y_predict.reshape(x0.shape)

    custom_cmap = ListedColormap(['#EF9A9A', 'black', '#90CAF9'])
    plt.contourf(x0, x1, zz, cmap=custom_cmap)


X = np.linspace(0, 5, 100)  # 生成数据
y = X ** 2 + 5 + np.random.randn(100)
x = X.reshape(-1, 1)
linear_svr = SVR(kernel="linear")  # 线性核
poly_svr = SVR(kernel="poly", degree=2)  # 多项式核
rbf_svr = SVR(kernel="rbf")  # 高斯核
# 训练
linear_svr.fit(x, y)
poly_svr.fit(x, y)
rbf_svr.fit(x, y)
# 测试
linear_pred = linear_svr.predict(x)
poly_pred = poly_svr.predict(x)
rbf_pred = rbf_svr.predict(x)
# 可视化
plt.plot(x, linear_pred, label='linear', color='red')
plt.plot(x, poly_pred, label='poly', color='orange')
plt.plot(x, rbf_pred, label='rbf', color='green')
plt.scatter(X, y, color='lightblue')
plt.legend()
plt.show()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44

在这里插入图片描述
参考文献：《机器学习》周志华

原创不易，请勿转载（~~本不富裕的访问量雪上加霜~~ ）
博主首页：https://wzlodq.blog.csdn.net/
来都来了，不评论两句吗👀
如果文章对你有帮助，记得一键三连❤

相关阅读:
了解string以及简单模拟实现（c++）
SAP 控制VA02修改客户地址是否同步修改参考关联的销售订单
HOOPS Commuicator：基于Web的交互式2D/3D图形轻量化引擎
【深入理解C++】空类对象所占用的空间大小
通过此文让你全面了解Thread线程的基本操作
商品分类代码
微前端是模块化后的最终选择
Python中给字典排序的三种方法(有一种你绝对没见过)
java中使用jacob实现word转pdf文件下载
JavaScript原型链

原文地址：https://blog.csdn.net/qq_45034708/article/details/127324747