• 拉格朗日乘子法、极大似然估计、EM算法


    基本概念:

    拉格朗日乘子法和极大似然估计有什么关系?

    拉格朗日乘子用于带约束的优化问题,极大似然估计用于最大化后验概率求参数问题。

    极大似然和EM有什么关系?

    极大似然估计适合求解不含隐变量的参数问题,而EM算法是用于求解含有隐变量的参数问题。

    拉格朗日乘子法:

    z = f ( x , y ) z=f(x,y) z=f(x,y)在约束条件 φ ( x , y ) = 0 \varphi(x,y)=0 φ(x,y)=0 h ( x , y ) = 0 h(x,y)=0 h(x,y)=0下的极值:

    1、拉格朗日函数:
    F ( x , y , λ , μ ) = f ( x , y ) + λ φ ( x , y ) + μ h ( x , y ) F(x,y,\lambda,\mu)=f(x,y)+\lambda \varphi(x,y)+\mu h(x,y) F(x,y,λ,μ)=f(x,y)+λφ(x,y)+μh(x,y)
    2、求偏导等于0的方程组:
    { F x ′ = 0 F y ′ = 0 F φ ′ = 0 F μ ′ = 0 \left\{ Fx=0Fy=0Fφ=0Fμ=0 \right. Fx=0Fy=0Fφ=0Fμ=0

    极大似然估计法:

    在给定概率模型和一组相互独立的观测样本 x 1 , x 2 , ⋯   , x n x_1,x_2,\cdots,x_n x1,x2,,xn的基础上,求解使得似然函数 L ( θ ) L(\theta) L(θ)

    1、写出似然函数:

    连续型:
    L ( θ ) = L ( x 1 , x 2 , ⋯   , x n ; θ ) = ∏ i = 1 n f ( x i ∣ θ ) L(\theta)=L(x_1,x_2,\cdots,x_n;\theta)=\prod_{i=1}^{n}{f(x_i|\theta)} L(θ)=L(x1,x2,,xn;θ)=i=1nf(xiθ)
    离散型:
    L ( θ ) = L ( x 1 , x 2 , ⋯   , x n ; θ ) = ∏ i = 1 n p ( x i ∣ θ ) L(\theta)=L(x_1,x_2,\cdots,x_n;\theta)=\prod_{i=1}^{n}{p(x_i|\theta)} L(θ)=L(x1,x2,,xn;θ)=i=1np(xiθ)
    2、取对数:

    连续型:
    l n [ L ( θ ) ] = l n [ ∏ i = 1 n f ( x i ∣ θ ) ] = ∑ i = 1 n l n [ f ( x i ∣ θ ) ] ln[L(\theta)]=ln[\prod_{i=1}^{n}{f(x_i|\theta)}]=\sum_{i=1}^{n}{ln[f(x_i|\theta)]} ln[L(θ)]=ln[i=1nf(xiθ)]=i=1nln[f(xiθ)]
    离散型:
    l n [ L ( θ ) ] = l n [ ∏ i = 1 n p ( x i ∣ θ ) ] = ∑ i = 1 n l n [ p ( x i ∣ θ ) ] ln[L(\theta)]=ln[\prod_{i=1}^{n}{p(x_i|\theta)}]=\sum_{i=1}^{n}{ln[p(x_i|\theta)]} ln[L(θ)]=ln[i=1np(xiθ)]=i=1nln[p(xiθ)]

    3、求 θ = [ θ 1 , θ 2 , ⋯   , θ m ] \theta=[\theta_1,\theta_2,\cdots,\theta_m] θ=[θ1,θ2,,θm]的偏导数:
    { ∂ l n ( θ 1 , θ 2 , ⋯   , θ m ) ∂ θ 1 = 0 ∂ l n ( θ 1 , θ 2 , ⋯   , θ m ) ∂ θ 2 = 0 ⋯ ∂ l n ( θ 1 , θ 2 , ⋯   , θ m ) ∂ θ m = 0 \left\{ ln(θ1,θ2,,θm)θ1=0ln(θ1,θ2,,θm)θ2=0ln(θ1,θ2,,θm)θm=0 \right. θ1ln(θ1,θ2,,θm)=0θ2ln(θ1,θ2,,θm)=0θmln(θ1,θ2,,θm)=0

    EM算法:

    隐变量指的是在事件发生时不知道的变量,例如抛硬币,两枚硬币的质量是不均匀的,不知道到每次取出的是哪一枚。

    使用EM算法能解决隐变量问题。EM算法由求期望和求最值两步推导得来:

    X X X:观测数据; Z Z Z:隐变量; θ \theta θ:待估计参数;
    θ ( t + 1 ) = a r g m a x θ ∫ Z p ( Z ∣ X , θ ( t ) ) l o g [ p ( X , Z ∣ θ ( t ) ) ] d Z \theta^{(t+1)}=\mathop{argmax}\limits_{\theta} \int_Z{p(Z|X,\theta^{(t)})log[p(X,Z|\theta^{(t)})]}dZ θ(t+1)=θargmaxZp(ZX,θ(t))log[p(X,Zθ(t))]dZ
    若是离散变量:
    θ ( t + 1 ) = a r g m a x θ ∑ Z { ∏ i = 1 N p ( z i ∣ x i , θ ( t ) ) l o g [ ∏ i = 1 N p ( x i , z i ∣ θ ( t ) ) ] } \theta^{(t+1)}=\mathop{argmax}\limits_{\theta} \sum_{Z}\{ \prod_{i=1}^{N}{p(z_i|x_i,\theta^{(t)})log[\prod_{i=1}^{N}p(x_i,z_i|\theta^{(t)})]}\} θ(t+1)=θargmaxZ{i=1Np(zixi,θ(t))log[i=1Np(xi,ziθ(t))]}

  • 相关阅读:
    主库添加temp文件,dg端不会同步增加temp文件的验证
    495. Teemo Attacking
    家电管理系统_家电进销系统(完整版,附带源码可以运行,可以商用)
    实现更低功耗R5F51406BDNE、R5F51406ADFK、R5F51406ADFL、R5F51406AGFN搭载RXv2内核的32位微控制器
    nginx路由location匹配规则及其优先级
    数据结构单链表的实现(C语言)
    Android开发基础:Activity的生命周期 Activity中的数据保持
    面试经验—底层软硬件研发工程师
    SpringCloud微服务:Nacos的下载和配置
    java计算机毕业设计springboot+vue基本微信的大学生竞赛报名小程序
  • 原文地址:https://blog.csdn.net/KPer_Yang/article/details/126514236