码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 初探softmax


    什么是softmax

    Softmax,又称作归一化指数函数。主要用于分类任务,降多分类的结果以概率的形式展现

    下图展示softmax计算方法

     

    softmax本质上是归一化网络,目的是将多个标量映射为一个概率分布,其输出的每一个值范围在(0,1)。

    举例

    1)将预测结果转化为非负数

    y1 = exp(x1) = exp(-3) = 0.05

    y2 = exp(x2) = exp(1.5) = 4.48

    y3 = exp(x3) = exp(2.7) = 14.88

    2)各种预测结果概率之和等于1

    z1 = y1/(y1+y2+y3) = 0.05/(0.05+4.48+14.88) = 0.0026

    z2 = y2/(y1+y2+y3) = 4.48/(0.05+4.48+14.88) = 0.2308

    z3 = y3/(y1+y2+y3) = 14.88/(0.05+4.48+14.88) = 0.7666

    总结一下softmax如何将多分类输出转换为概率,可以分为两步:

    1)分子:通过指数函数,将实数输出映射到零到正无穷。

    2)分母:将所有结果相加,进行归一化。

    干货

    Softmax主要是用于训练中。因为我们使用交叉熵损失函数的时候,实际做的的是最大似然估计MLE,即要求你的预测标签分布要与one-hot给的GT标签越贴近越好,既然是比较分布,那自然得通过softmax或者sigmoid做概率化操作。

    推理阶段是否需要softmax,需要视实际需求而定。

    (1)业务要求输出topN结果时,可以采用softmax讲预测结果转化为概率;

    (2)业务可以考虑网络的拒识情况。假设一个二分类问题,如果你采用softmax会发现两类的概率其实都在0.5附近,差别不是很大,这个时候就可以判定拒识,机器不能识别这张图片的类别,交给其他算法或者人工判别。

    参考文献

    softmax层的使用_Petersburg的博客-CSDN博客

    为什么神经网络的推理通常不使用 Softmax层,而神经网络的学习阶段则需要 Softmax层? - 知乎

  • 相关阅读:
    中断的分类、机理与嵌套:深入理解计算机系统的中断、陷入与异常
    Redisson-lock看门狗原理
    Java进阶——如何查看Java字节码
    Dockerfile 语法详解:构建定制化容器镜像的基石
    Charles模拟弱网
    kubernetes 的 重要IP 概念
    设计原则(七种)— 《软件工程与计算》笔记
    在Excel VBA中使用SQL到底优势在哪儿
    Maven常见面试题总结
    MySQL列(数据)类型介绍(bit类型实例)
  • 原文地址:https://blog.csdn.net/zhuwunengpp/article/details/127909995
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号