码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 04.9. 环境和分布偏移


    文章目录

      • 4.9. 环境和分布偏移
        • 4.9.1. 分布偏移的类型
          • 4.9.1.1. 协变量偏移
          • 4.9.1.2. 标签偏移
          • 4.9.1.3. 概念偏移
        • 4.9.2. 分布偏移示例
        • 4.9.3. 分布偏移纠正
        • 4.9.4. 学习问题的分类法
        • 4.9.5. 机器学习中的公平、责任和透明度
        • 4.9.6. 小结

    4.9. 环境和分布偏移

    • 数据最初从哪里来?
    • 最终如何处理模型的输出?

    当数据分布突然改变时,模型在部署中会出现灾难性的失败
    机器学习的许多应用中都存在类似的问题: 通过将基于模型的决策引入环境,可能会破坏模型。

    4.9.1. 分布偏移的类型

    首先,我们考虑数据分布可能发生变化的各种方式,以及为挽救模型性能可能采取的措施。

    4.9.1.1. 协变量偏移

    在不同分布偏移中,协变量偏移可能是最为广泛研究的。 这里我们假设:虽然输入的分布可能随时间而改变, 但标签函数(即条件分布)没有改变。
    统计学家称之为协变量偏移(covariate shift), 因为这个问题是由于协变量(特征)分布的变化而产生的。
    虽然有时我们可以在不引用因果关系的情况下对分布偏移进行推断, 但在我们认为导致的情况下,协变量偏移是一种自然假设。

    4.9.1.2. 标签偏移

    标签偏移(label shift)描述了与协变量偏移相反的问题。

    4.9.1.3. 概念偏移

    概念偏移(concept shift): 当标签的定义发生变化时,就会出现这种问题

    4.9.2. 分布偏移示例

    • 医学诊断
    • 自动驾驶
    • 非平稳分布
    • 。。。

    4.9.3. 分布偏移纠正

    • 经验风险与实际风险
    • 协变量偏移纠正
    • 标签偏移纠正
    • 概念偏移纠正

    4.9.4. 学习问题的分类法

    • 批量学习
    • 在线学习
    • 老虎机
    • 控制
    • 强化学习
    • 考虑到环境

    4.9.5. 机器学习中的公平、责任和透明度

    • 从考虑预测到决策的飞跃不仅提出了新的技术问题, 而且还提出了一系列必须仔细考虑的伦理问题。
    • 注意是否解决了正确的问题。
    • 通常,在建模纠正过程中,模型的预测与训练数据耦合的各种机制都没有得到解释,

    4.9.6. 小结

    • 在许多情况下,训练集和测试集并不来自同一个分布。这就是所谓的分布偏移。

    • 真实风险是从真实分布中抽取的所有数据的总体损失的预期。然而,这个数据总体通常是无法获得的。经验风险是训练数据的平均损失,用于近似真实风险。在实践中,我们进行经验风险最小化。

    • 在相应的假设条件下,可以在测试时检测并纠正协变量偏移和标签偏移。在测试时,不考虑这种偏移可能会成为问题。

    • 在某些情况下,环境可能会记住自动操作并以令人惊讶的方式做出响应。在构建模型时,我们必须考虑到这种可能性,并继续监控实时系统,并对我们的模型和环境以意想不到的方式纠缠在一起的可能性持开放态度。

  • 相关阅读:
    springboot停车场车辆定位管理可视化分析系统的设计与实现毕业设计源码101702
    【数据结构】链表面试题
    奔驰E Coupe 升级鼠标按键 操作简单 完美结合
    ChatGLM2_6b安装
    YBTOJ 树形dp合集
    第一个servlet的程序
    JDBC快速入门和获取数据库的连接方式
    百度智能云专有云多云管理平台解决方案荣获《可信云多云管理平台解决方案》权威认证
    函数题39 习题10-11 有序表的增删改查操作《C语言程序设计(第4版)》题目集
    uniapp实现点击标签文本域中显示标签内容
  • 原文地址:https://blog.csdn.net/weixin_45063703/article/details/126807402
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号