支持向量机SVM

支持向量机SVM
13. 支持向量机SVM
文章目录
- 13. 支持向量机SVM
  13.1 简介
  13.2 硬间隔和软间隔
  13.2.1 硬间隔
  13.2.2 软间隔
  
  13.3 API
  13.3.1 使用SVM作为训练模型时，通常流程
  13.3.2 sklearn中支持向量分类三种方法
  
  13.4 算法原理
  13.4.1 目标函数
  13.4.2 目标函数求解过程
  
  13.5 损失函数
  13.6 核方法
  13.7 SVM回归
  13.8 案例：数字识别器
  13.9 SVM总结
  13.9.1 优点
  13.9.2 缺点
13.1 简介

SVM全称是supported vector machine（支持向量机），即寻找到一个超平面使样本分成两类，并且间隔最大

SVM能够执行线性或非线性分类、回归，甚至是异常值检测任务。它是机器学习领域最受欢迎的模型之一。SVM特别适用于中小型复杂数据集的分类

 13.2 硬间隔和软间隔

13.2.1 硬间隔
- 只有在数据是线性可分离的时候才有效
- 对异常值非常敏感
13.2.2 软间隔
- 尽可能在保持最大间隔宽阔和限制间隔违例之间找到良好的平衡
13.3 API

from sklearn import svm

SVM具有良好的鲁棒性，对未知数据拥有很强的泛化能力，特别是在数据量较少的情况下，相较其他传统机器学习算法具有更优的性能

13.3.1 使用SVM作为训练模型时，通常流程
- 对样本数据进行归一化
- 用核函数对样本进行映射（最常采用和核函数是RBF和Linear，在样本线性可分时，Linear效果要比RBF好）
- 用cross-validation和grid-search对超参数进行优选
- 用最优参数训练得到模型
- 测试
13.3.2 sklearn中支持向量分类三种方法
- SVC
  - class sklearn.svm.SVC(C=1.0, kernel=‘rbf’, degree=3,coef0=0.0,random_state=None)
    
    C: 惩罚系数，用来控制损失函数的惩罚系数，类似于线性回归中的正则化系数
    kernel: 算法中采用的核函数类型，核函数是用来将非线性问题转化为线性问题的一种方法
    degree:
    当指定kernel为’poly’时，表示选择的多项式的最高次数，默认为三次多项式；
    若指定kernel不是’poly’，则忽略，即该参数只对’poly’有用。
    coef0: 核函数常数值(y=kx+b中的b值)
- NuSVC
  - class sklearn.svm.NuSVC(nu=0.5)
    
    nu：训练误差部分的上限和支持向量部分的下限，取值在（0，1）之间，默认是0.5
- LinearSVC
  - class sklearn.svm.LinearSVC(penalty=‘l2’, loss=‘squared_hinge’, dual=True, C=1.0)
    
    penalty:正则化参数
    loss:损失函数
    dual:是否转化为对偶问题求解，默认是True
    C:惩罚系数
13.4 算法原理

支持向量机通俗导论（理解SVM的三层境界）LaTeX最新版_2015.1.9

pdf 5星超过95%的资源 1.48MB

下载

13.4.1 目标函数
13.4.2 目标函数求解过程
- 对目标函数添加符号，转换为求最小值
- 求得超平面
- 求得分类决策函数
13.5 损失函数
- 0/1损失函数
- Hinge损失函数
- Logistic损失函数
13.6 核方法

核函数
- 将原始输入空间映射到新的特征空间，从而，使得原本线性不可分的样本可能在核空间可分
- 常见核函数
WinSVM支持向量机

application/x-rar 5星超过95%的资源 232KB

下载

 13.7 SVM回归
- 让尽可能多的实例位于预测线上，同时限制间隔违例
- 线距的宽度由超参数ε控制
13.8 案例：数字识别器

 13.9 SVM总结

一种二类分类模型

在特征空间中寻找间隔最大化的分离超平面的线性分类器

13.9.1 优点
- 在高维空间中非常高效
- 即使在数据维度比样本数量大的情况下仍然有效
- 在决策函数（称为支持向量）中使用训练集的子集,因此它也是高效利用内存的
- 通用性：不同的核函数与特定的决策函数一一对应
13.9.2 缺点
- 如果特征数量比样本数量大得多，在选择核函数时要避免过拟合
- 对缺失数据敏感
- 对于核函数的高维映射解释力不强
相关阅读:
2022社交电商（众城优选）最火引流拓客新思路，微三云胡佳东
 点击授权将用户信息存储到vuex中
 【HTML】猜拳小游戏
 瑞吉外卖（五）全局异常处理
 深入探索Spring Boot的自动配置机制
 基于costas环的载波同步系统matlab性能仿真
 Win11右键菜单怎么改为Win10？
高性能API云原生网关 APISIX安装与配置指南
 【笔记】神经网络中的注意力机制
 vim编辑器
原文地址：https://blog.csdn.net/weixin_44226181/article/details/126170468

13. 支持向量机SVM

文章目录

13.1 简介

13.2 硬间隔和软间隔

13.2.1 硬间隔

13.2.2 软间隔

13.3 API

13.3.1 使用SVM作为训练模型时，通常流程

13.3.2 sklearn中支持向量分类三种方法

13.4 算法原理

13.4.1 目标函数

13.4.2 目标函数求解过程

13.5 损失函数

13.6 核方法

13.7 SVM回归

13.8 案例：数字识别器

13.9 SVM总结

13.9.1 优点

13.9.2 缺点