码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 支持向量机SVM


    13. 支持向量机SVM

    文章目录

      • 13. 支持向量机SVM
        • 13.1 简介
        • 13.2 硬间隔和软间隔
          • 13.2.1 硬间隔
          • 13.2.2 软间隔
        • 13.3 API
          • 13.3.1 使用SVM作为训练模型时,通常流程
          • 13.3.2 sklearn中支持向量分类三种方法
        • 13.4 算法原理
          • 13.4.1 目标函数
          • 13.4.2 目标函数求解过程
        • 13.5 损失函数
        • 13.6 核方法
        • 13.7 SVM回归
        • 13.8 案例:数字识别器
        • 13.9 SVM总结
          • 13.9.1 优点
          • 13.9.2 缺点

    13.1 简介

    SVM全称是supported vector machine(支持向量机),即寻找到一个超平面使样本分成两类,并且间隔最大

    在这里插入图片描述

    SVM能够执行线性或非线性分类、回归,甚至是异常值检测任务。它是机器学习领域最受欢迎的模型之一。SVM特别适用于中小型复杂数据集的分类

    13.2 硬间隔和软间隔

    13.2.1 硬间隔

    • 只有在数据是线性可分离的时候才有效
    • 对异常值非常敏感

    13.2.2 软间隔

    • 尽可能在保持最大间隔宽阔和限制间隔违例之间找到良好的平衡

    13.3 API

    from sklearn import svm

    SVM具有良好的鲁棒性,对未知数据拥有很强的泛化能力,特别是在数据量较少的情况下,相较其他传统机器学习算法具有更优的性能

    13.3.1 使用SVM作为训练模型时,通常流程

    • 对样本数据进行归一化
    • 用核函数对样本进行映射(最常采用和核函数是RBF和Linear,在样本线性可分时,Linear效果要比RBF好)
    • 用cross-validation和grid-search对超参数进行优选
    • 用最优参数训练得到模型
    • 测试

    13.3.2 sklearn中支持向量分类三种方法

    • SVC

      • class sklearn.svm.SVC(C=1.0, kernel=‘rbf’, degree=3,coef0=0.0,random_state=None)

        • C: 惩罚系数,用来控制损失函数的惩罚系数,类似于线性回归中的正则化系数
        • kernel: 算法中采用的核函数类型,核函数是用来将非线性问题转化为线性问题的一种方法
        • degree:
          当指定kernel为’poly’时,表示选择的多项式的最高次数,默认为三次多项式;
          若指定kernel不是’poly’,则忽略,即该参数只对’poly’有用。
        • coef0: 核函数常数值(y=kx+b中的b值)
    • NuSVC

      • class sklearn.svm.NuSVC(nu=0.5)

        • nu: 训练误差部分的上限和支持向量部分的下限,取值在(0,1)之间,默认是0.5
    • LinearSVC

      • class sklearn.svm.LinearSVC(penalty=‘l2’, loss=‘squared_hinge’, dual=True, C=1.0)

        • penalty:正则化参数
        • loss:损失函数
        • dual:是否转化为对偶问题求解,默认是True
        • C:惩罚系数

    13.4 算法原理

    支持向量机通俗导论(理解SVM的三层境界)LaTeX最新版_2015.1.9
    pdf 5星 超过95%的资源 1.48MB
    下载

    13.4.1 目标函数

    • 在这里插入图片描述

    13.4.2 目标函数求解过程

    • 在这里插入图片描述

      • 在这里插入图片描述
    • 对目标函数添加符号,转换为求最小值

      • 在这里插入图片描述
    • 在这里插入图片描述

    • 在这里插入图片描述

      • 在这里插入图片描述
    • 求得超平面

      • 在这里插入图片描述
    • 求得分类决策函数

      • 在这里插入图片描述

    13.5 损失函数

    • 0/1损失函数

    • Hinge损失函数

    • Logistic损失函数

    在这里插入图片描述

    13.6 核方法

    核函数

    • 将原始输入空间映射到新的特征空间,从而,使得原本线性不可分的样本可能在核空间可分

      • 在这里插入图片描述
    • 常见核函数

      • 在这里插入图片描述
    WinSVM支持向量机
    application/x-rar 5星 超过95%的资源 232KB
    下载

    13.7 SVM回归

    • 让尽可能多的实例位于预测线上,同时限制间隔违例
    • 线距的宽度由超参数ε控制

    13.8 案例:数字识别器

    13.9 SVM总结

    一种二类分类模型

    在特征空间中寻找间隔最大化的分离超平面的线性分类器

    13.9.1 优点

    • 在高维空间中非常高效
    • 即使在数据维度比样本数量大的情况下仍然有效
    • 在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的
    • 通用性:不同的核函数与特定的决策函数一一对应

    13.9.2 缺点

    • 如果特征数量比样本数量大得多,在选择核函数时要避免过拟合
    • 对缺失数据敏感
    • 对于核函数的高维映射解释力不强
  • 相关阅读:
    2022社交电商(众城优选)最火引流拓客新思路,微三云胡佳东
    点击授权将用户信息存储到vuex中
    【HTML】猜拳小游戏
    瑞吉外卖(五) 全局异常处理
    深入探索Spring Boot的自动配置机制
    基于costas环的载波同步系统matlab性能仿真
    Win11右键菜单怎么改为Win10?
    高性能API云原生网关 APISIX安装与配置指南
    【笔记】神经网络中的注意力机制
    vim编辑器
  • 原文地址:https://blog.csdn.net/weixin_44226181/article/details/126170468
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号