码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 寻找更好的分类模型loss


    寻找更好的loss

    • 1.CE loss并不完美
    • 2.可能更好的loss函数
      • 2.1 CC-LOSS
      • 2.2 Center-LOSS
    • 参考文献

    1.CE loss并不完美

    最常用于深度学习分类模型的损失函数可以说就是CE(交叉熵) loss了。正如CC-LOSS paper中所述,该loss更关注各类是否separated,而非不同类之间距离远/相同类聚类更近这样的模式识别分类基本要求。这样可能导致过拟合或者泛化能力弱等缺点。

    CE-Loss has two main issues that limit the performance of a CNN model for classification.

    • Firstly, the high level features extracted by CNNs with the CE-Loss are only separable with each other but not discriminative enough, which can easily lead to over-fitting of the model and thus weak generalization performance.
    • Secondly, the parameters of the deep CNN model are trained jointly with all the classes, which makes the high level features extracted by CNNs to be confused with each other and increases the difficulty of optimization.

    2.可能更好的loss函数

    2.1 CC-LOSS

    在这里插入图片描述
    其损失函数为交叉熵损失,再额外加上一部分,即类内距离之和/类间距离之和:
    在这里插入图片描述
    在这里插入图片描述
    其在MNIST数据集上表现如下,感觉不够惊喜,与CE-LOSS相差不大,并没有达到所提出的类内compact,类间dispense这样的程度。
    在这里插入图片描述

    2.2 Center-LOSS

    paper 见A Discriminative Feature Learning Approachfor Deep Face Recognition。整体来说它的策略也很简单,即除了CE,再额外一部分损失,该损失是为了使得某一层学习到的特征及学习到center之间距离尽可能接近。
    在这里插入图片描述

    在这里插入图片描述
    它的pytorch实现可参考https://github.com/KaiyangZhou/pytorch-center-loss,git中也展示了mnist数据集上,使用center-loss前后的效果。

    参考文献

    [1] CC-LOSS: CHANNEL CORRELATION LOSS FOR IMAGE CLASSIFICATION
    [2] Wen et al. A Discriminative Feature Learning Approach for Deep Face Recognition. ECCV 2016
    [3] https://github.com/KaiyangZhou/pytorch-center-loss

  • 相关阅读:
    【用户画像】ClickHouse简介、特点、安装和部署
    基于场景分析法的电动车优化调度(Matlab代码实现)
    GRU门控循环单元
    Java学习笔记4.2.1 系统类 - System类
    JVM诊断及工具笔记(4) 使用visualvm分析JVM堆内存泄漏
    Total derivative
    Docker笔记-10 Swarm mode
    【os-tutorial】四,电脑存储的组织形式
    机器学习深度学习服务器推荐
    凌恩客户文献|《ISME》解析土壤侵蚀对微生物群落结构以及网络功能复杂性影响
  • 原文地址:https://blog.csdn.net/WANGWUSHAN/article/details/127970143
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号