学习笔记:机器学习之支持向量机(二)

活动地址：CSDN21天学习挑战赛

1 线性可分支持向量机的对偶问题

对偶问题可以降低问题的求解难度，可由线性分类问题推广到非线性分类问题.

2 构造拉格朗日函数(算法肢解)

这是最大间隔算法的原始形式
在这里插入图片描述

构造拉格朗日函数将目标函数和约束条件联系起来 ,原始形式约束条件式子中有n个不等式,所以这里我们对每一个不等式约束引入一个拉格朗日乘子 $\alpha_i \ge0,i=1,2,...,N$ .
该问题的拉格朗日函数如下: $L(w,b,\alpha)=\frac{1}{2}||w||^2-\sum_i^N \alpha_i y_i(w \cdot x_i+b)+\sum_i^N \alpha_i$
原始问题的对偶问题为该拉格朗日函数的极大极小问题,即先求 $L(w,b,\alpha)$ 对w,b的极小值,再对 $\alpha$ 求极大值.
即: $\mathop{\max}\limits_{\alpha}\min\limits_{w,b}L(w,b,\alpha)$
(1)求 $\min\limits_{w,b}L(w,b,\alpha)$
令 $\theta_0(\alpha)=\min\limits_{w,b}L(w,b,\alpha)$
求极值就分别对w,b求偏导等于0.
$\nabla_xL(w,b,\alpha)=w-\sum_i^N \alpha_i y_ix_i=0\\\nabla_bL(w,b,\alpha)=-\sum_i^N \alpha_i y_i=0$
解得w,b.
$\left\{$

\begin{aligned} w = \sum_{i}^{N} α_{i} y_{i} x_{i} \\ \sum_{i}^{N} α_{i} y_{i} = 0 \end{aligned}

\right.

⎩ ⎨ ⎧ w = i \sum N α_{i} y_{i} x_{i} i \sum N α_{i} y_{i} = 0

则

\theta_0(\alpha)=\frac{1}{2}\sum_{i=1}^N\sum_{j=1}^N\alpha_i\alpha_j y_i y_j(x_i \cdot x_j)-\sum_{i=1}^N\alpha_iy_i(\sum_{j=1}^N\alpha_iy_j*((x_i \cdot x_j))+\sum_{j=1}^N\alpha_i \\ =\sum_{j=1}^N\alpha_i-\frac{1}{2}\sum_{i=1}^N\sum_{j=1}^N\alpha_i\alpha_j y_i y_j(x_i \cdot x_j)

(2 )求

\max\limits_{\alpha}\theta_0(\alpha)

$\left\{$

\begin{aligned} max_{α} θ_{0} (α) \\ s . t . \sum_{i = 1}^{N} α_{i} y_{i} = 0, α_{i} \geq 0, i = 1, 2, . . ., N \end{aligned}

\right.

⎩ ⎨ ⎧ α max θ_{0} (α) s . t . i = 1 \sum N α_{i} y_{i} = 0, α_{i} \geq 0, i = 1, 2, ..., N

上式约束条件中，拉格朗日乘子大于等于0

KKT条件

则该问题中KKT条件第一条为：
$\nabla_wL=w^*-\sum_i^N \alpha_i^* y_ix_i=0 \quad(1)$
对于互补松弛条件有 $\alpha_i(1-y_i(w^*\cdot x_j+b^*))=0,\alpha_i \ge0$
则 $1-y_i(w^*\cdot x_j+b^*)=0\quad(2)$
由（1）（2）解的原始问题中w,b
$\left\{$

\begin{aligned} w^{*} & = \sum_{i = 1}^{N} α_{i}^{*} y_{i} x_{i} \\ b^{*} & = y_{j} - \sum_{i = 1}^{N} α_{i}^{*} y_{i} (x_{i} \cdot x_{j}) \end{aligned}

\right.

⎩ ⎨ ⎧ w^{*} b^{*} = i = 1 \sum N α_{i}^{*} y_{i} x_{i} = y_{j} - i = 1 \sum N α_{i}^{*} y_{i} (x_{i} \cdot x_{j})

此时就得到分类超平面：

\sum_{i=1}^N \alpha_i^* y_i(x_i \cdot x)-\sum_{i=1}^N \alpha_i^* y_i(x_i\cdot x_j)+y_i=0

分类决策函数为：

f(x)=sign(\sum_{i=1}^N \alpha_i^* y_i(x_i \cdot x)-\sum_{i=1}^N \alpha_i^* y_i(x_i\cdot x_j)+y_i)

3 线性可分支持向量机算法——最大间隔算法对偶形式

输入：数据集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\},x_i \in R^n,y_i \in\{-1,1\},i=1,2,...,N.$
输出：分离超平面、分类决策函数

在这里插入图片描述

参考

https://mp.weixin.qq.com/s/886_EdhRtRFCeof0xaPDhw
https://www.bilibili.com/video/BV1HP4y1Y79e?spm_id_from=333.337.search-card.all.click&vd_source=893fb409f9a0bd0a8c04972fb40b53b3

相关阅读:
小杨哥陷入打假风波，会变成下一个辛巴吗？
链路状态路由协议OSPF的LSA头部讲解
被Chatgpt碾压的打工人与大学生，准备反击！
每日学一个设计模式22——命令模式
Transformer模型
饥荒服务器阿里云租用价格表一年和一个月收费报价表
Git基本操作（1）
Springboot基于微信小程序的高校食堂外卖服务毕业设计-附源码200910
[PAT练级笔记] 12 Basic Level 1014
Linux高负载排查最佳实践

原文地址：https://blog.csdn.net/qq_44635691/article/details/126292351

学习笔记:机器学习之支持向量机(二)

​1 线性可分支持向量机的对偶问题

2 构造拉格朗日函数(算法肢解)

KKT条件

3 线性可分支持向量机算法——最大间隔算法对偶形式

参考

1 线性可分支持向量机的对偶问题