• 【DeepLearning】【PyTorch 】PyTorch 损失函数封装中 size_average、reduce 和 reduction 三个参数的意义


    本文主要说明 PyTorch 损失函数封装中 size_average、reduce 和 reduction 三个参数的意义.

    PyTorch 中提供损失函数的 类封装 torch.nn.modules.loss 和 函数封装 torch.nn.functional. 他们有 size_average、size_average、reduction 三个参数,这三个参数理解起来有些复杂,做以下纪录.

    • size_average (布尔类型, 可选参数)
      已过时(Deprecated)(见 reduction). 一般地,losses 损失函数值为 batch 中对所有 loss 元素的平均值. 这里注意,对有些类型的损失函数,在单个训练样本中存在多个元素. 如果 size_average 域设为 False,losses 损失函数值为 minibatch 中对所有 loss 元素的求和. 当 reduce 设为 False 时,忽略 size_average 域. 缺省为:True.

    • reduce (布尔类型, 可选参数)
      已过时(Deprecated)(见 reduction). 一般地,losses 损失函数值为 minibatch 中对所有 loss 张量元素的平均值或求和,这取决于 size_average 域的设置. 当 reduce 为 False,返回 batch 中每个样本的 loss 值,并忽略 size_average. 缺省为:True.

    • reduction (字符串类型, 可选参数) ’
      确定对 loss 输出结果应用 reduction 的类型: ‘none’ | ‘mean’ | ‘sum’ . 注意,size_average 和 reduce 将在后续版本中被弃用(being deprecated),但与此同时,这两个参数的设置将覆盖 reduction. 缺省为:‘mean’.

      • ‘none’:无 reduction 被应用.
      • ‘mean’:对输出结果求和并除以输出结果张量中的元素个数.
      • ‘sum’:对输出结果求和.

    以上内容翻译自 PyTorch 官方文档,但是并不易于理解. 简单来说:

    reduce 决定是求整个 batch 的 loss 值,还是求 batch 中每个 sample 的 loss 值. 默认为 True 求整个 batch 的 loss 值.

    size_average 决定 loss 是求平均还是求和. 默认为 True 求平均. 并且当为 False 时,忽略 reduce 的设置.

    reduction的作用等同于 size_average + reduce. ‘none’ 为求 minibatch 中每个 sample 的 loss 值. ‘mean’ 为求整个 minibatch 的 loss 值,对 minibatch 中所有 sample 的 loss 值求平均. ‘sum’ 为求整个 minibatch 的 loss 值, 对 minibatch 中所有 sample 的 loss 值求和.

  • 相关阅读:
    矩阵分析与应用-06-概率密度函数01
    OpenResty编译安装详解
    C++ - 红黑树 介绍 和 实现
    Opencv基本操作 (上)
    pdf如何转换成excel?教你几个方法
    liveData和viewBinding的使用
    30天自制操作系统(第23天)
    【frp】服务端配置与systemd启动
    React高频面试题(附答案)
    asp.net core session的使用
  • 原文地址:https://blog.csdn.net/ZauberC/article/details/127754385