目录
x表示概率,θ表示要估计的参数。
我们定义一个极大似然函数,使这个函数最大。
直接对
求导比较麻烦,所以我们将似然函数
转化成对数的形式,来求
的最大值

举个例子:
高斯分布和样本如下所示:

定义对数似然函数:

要求L的最大值,就需要求导。
对u求偏导:

这个u实际上就是样本均值。
对σ求偏导:

实际上就是方差。
那么,样本方差与极大似然估计的方差有什么区别呢?
答:极大似然估计出来的方差是有偏估计。
x为n维的矩阵,y为实数。

我们定义一个多元线性方程
![]()
拟合误差为:
为真实值,
是拟合出来的值。
![]()
假设误差服从标准正态分布:

我们定义一个极大似然函数:

则最大化似然函数L,相当于最小化
,即最小化拟合误差。

如何对J进行最小化呢?
求导得到:![]()
移项得到:
我们对
进行变换,
和
为两个列向量,则
是一个实数,最终
变换为
。

即得到:
则w等于:
对比之前讲到的最小二乘得到的结果![]()
可以看到二者是相同的。