码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 交叉熵与对数似然分析


    信息论(Information Theory)

    • “信息”是指一组消息的集合。

    • 假设在一个噪声通道上发送消息,我们需要考虑如何对每一个信息进行编码、传输以及解码,使得接收者可以尽可能准确地重构出消息。

    • 信息论将信息的传递看作一种统计现象。

      • 信息传输

      • 信息压缩

    熵(Entropy)

    在信息论中,熵用来衡量一个随机事件的不确定性。

    • 熵越高,则随机变量的信息越多;
    • 熵越低,则随机变量的信息越少.

    applicatio_确定性非常高,p(x=n)=1

    appl_那么有apple或apply两种可能,假设

    (1)P(x=e)=0.7(2)P(x=y)=0.3

    自信息(Self Information):一个随机事件所包含的信息量

    对于一个随机变量X,当X=x时的自信息I(x)定义为

    I(x)=−log⁡p(x)

    这样定义,让它满足可加性

    (3)I(x,x′)=−[log⁡p(x)+log⁡p(x′)](4)=−log⁡(p(x)⋅p(x′))

    熵:随机变量X的自信息的数学期望

    (5)H(x)=Ex[I(x)](6)=Ex[−log⁡p(x)](7)=−∑x∈χp(x)log⁡p(x)

    熵编码(Entropy Encoding)

    在对分布p(y)的符号进行编码时,熵H(p)也是理论上最优的平均编码长度,这种编码方式称为熵编码。

    什么样的编码是最优编码呢?最常出现的字符编码越短,出现频率越小的字符编码越长。

    交叉熵(Cross Entropy)

    交叉熵是按照概率分布q的最优编码对真实分布为p的信息进行编码的长度。

    H(p,q)=Ep[−log⁡q(x)]=−∑xp(x)log⁡q(x)

    • 在给定q的情况下,如果p和q越接近,交叉熵越小;
    • 如果p和q越远,交叉嫡就越大。

    KL散度(Kullback-Leibler Divergence)

    • KL散度是用概率分布q来近似p时所造成的信息损失量。
    • KL散度是按照概率分布q的最优编码对真实分布为p的信息进行编码,其平均编码长度(即交叉熵)H(pq)和p的最优平均编码长度(即熵)H(p)之间的差异。

    KL(p,q)=H(p,q)−H(p)=∑xp(x)log⁡p(x)q(x)

    应用到机器学习

    以分类为例

    真实分布

    Pr(y|x)

    预测分布

    Pθ(y|x)

    假设y*为x的真实标签

    (8)Pr(y∗|x)=1(9)Pr(y|x)=0,∀y≠y∗

    真实分布相当于onehot向量

    (10)[00010]c=Pr(y|x)

    如何衡量两个分布的差异?

    课程视频链接:3.3交叉熵与对数似然

    原创作者:孤飞-博客园
    原文链接:https://www.cnblogs.com/ranxi169/p/16583838.html

  • 相关阅读:
    关于NPM下载源的总结
    【C++布隆过滤器和哈希切分】
    Vue2电商前台项目——项目的初始化及搭建
    ArcGIS笔记12_ArcGIS搜索工具没法用?ArcGIS运行很慢很卡?
    Linux常用命令(3)-文件和目录管理
    Android Killer v1.3.1版本太低无法正常反编译及回编的问题
    scratch绘制红蓝线条 电子学会图形化编程scratch等级考试四级真题和答案解析2022年9月
    深度解密Go底层Map
    如何快速地生成一个Python项目的requirements.txt
    maven私服搭建
  • 原文地址:https://www.cnblogs.com/ranxi169/p/16583838.html
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号