线性高斯分布,也称为高斯线性模型或条件高斯分布,是一种特定的概率分布模型,涉及到变量之间的线性关系,其中变量服从高斯(正态)分布。这个模型广泛应用于统计学、信号处理、机器学习等领域,特别是在贝叶斯网络和卡尔曼滤波中非常重要。
线性高斯模型可以描述为:
x = A z + b + ϵ x = Az + b + \epsilon x=Az+b+ϵ
其中,
在这个模型中,给定 z z z的条件下, x x x的分布是高斯分布,其均值是线性依赖于 z z z的,而协方差是固定的。这种属性使得线性高斯模型在分析和计算上非常方便,特别是可以通过解析方法来进行推断和参数估计。
总的来说,线性高斯模型因其数学上的简洁性和强大的理论基础,在众多领域都有广泛的应用。
让我们以贝叶斯线性回归为例,来说明线性高斯模型的一个应用。在贝叶斯线性回归中,我们对参数的不确定性采用概率的方式来建模。
假设我们有一组观测数据 { ( x i , y i ) } i = 1 N \{(x_i, y_i)\}_{i=1}^{N} {(xi,yi)}i=1N,其中 x i x_i xi 是自变量, y i y_i yi 是因变量。我们想要找到 x x x 和 y y y 之间的线性关系。线性高斯模型可以表示为:
y i = β x i + ϵ i y_i = \beta x_i + \epsilon_i yi=βxi+ϵi
这里,
在贝叶斯框架中,除了数据生成模型外,我们还会对参数 β \beta β有一个先验分布。简单起见,我们可以假设 β \beta β也服从高斯分布,即 β ∼ N ( μ 0 , σ 0 2 ) \beta \sim \mathcal{N}(\mu_0, \sigma_0^2) β∼N(μ0,σ02)。
贝叶斯线性回归的目标是计算后验分布 p ( β ∣ x , y ) p(\beta | \mathbf{x}, \mathbf{y}) p(β∣x,y),其中 x \mathbf{x} x 和 y \mathbf{y} y 分别是自变量和因变量的向量。根据贝叶斯定理,后验分布与似然 p ( y ∣ x , β ) p(\mathbf{y} | \mathbf{x}, \beta) p(y∣x,β)和先验 p ( β ) p(\beta) p(β)成正比:
p ( β ∣ x , y ) ∝ p ( y ∣ x , β ) p ( β ) p(\beta | \mathbf{x}, \mathbf{y}) \propto p(\mathbf{y} | \mathbf{x}, \beta) p(\beta) p(β∣x,y)∝p(y∣x,β)p(β)
在这个例子中,似然函数 p ( y ∣ x , β ) p(\mathbf{y} | \mathbf{x}, \beta) p(y∣x,β) 也是高斯分布的,因此在先验和似然都是高斯分布的情况下,后验分布也将是高斯分布。利用这个性质,我们可以得到 β \beta β的后验分布的解析表达式。
最后,我们可以使用这个后验分布来估计 β \beta β的值,以及计算新自变量 x new x_{\text{new}} xnew 对应的 y y y 的预测分布 p ( y new ∣ x new , x , y ) p(y_{\text{new}} | x_{\text{new}}, \mathbf{x}, \mathbf{y}) p(ynew∣xnew,x,y)。
这个例子展示了线性高斯模型在贝叶斯统计中的应用,特别是它如何允许我们得到参数的后验分布的解析解,以及如何在存在不确定性的情况下做出预测。