【白板推导系列笔记】线性分类-高斯判别分析（Gaussian Discriminant Analysis）-模型定义 - 码农知识堂

【白板推导系列笔记】线性分类-高斯判别分析（Gaussian Discriminant Analysis）-模型定义

$\begin{matrix} {(x_{i}, y_{i})}_{i = 1}^{N}, x_{i} \in R^{p}, y_{i} \in {0, 1} \end{matrix}$ ${(x_{i}, y_{i})}_{i = 1}^{N}, x_{i} \in R^{p}, y_{i} \in {0, 1}$
逻辑回归是直接对 $p (y ∣ x)$ 建模，而高斯判别分析作为概率生成模型，是通过引入类型的先验，通过贝叶斯公式，得到联合分布 $p (x, y) = p (x ∣ y) p (y)$ ，再对联合分布的对数似然得到参数

贝叶斯公式为
$p(y|x)=\frac{p(x|y)p(y)}{p(x)}$

但是由于我们只关心
$\begin{aligned} p (y = 1 | x) = \frac{p (x | y = 1) p (y = 1)}{p (x)} \end{aligned}$ $p (y = 1∣ x) = \frac{p ( x ∣ y = 1 ) p ( y = 1 )}{p ( x )}$ 和 $\begin{aligned} p (y = 0 | x) = \frac{p (x | y = 0) p (y = 0)}{p (x)} \end{aligned}$ 的大小关系，因此不需要关注分母，因为二者是一样的，即
$\begin{aligned} \hat{y} & = \underset{y \in {0, 1}}{a r g m a x} p (y | x) \\ 由于 p (y | x) \propto p (x | y) p (y) \\ = \underset{y}{a r g m a x} p (y) \cdot p (x | y) \end{aligned}$
高斯判别分析我们对数据集作出的假设有，类的先验是二项分布，每一类的似然是高斯分布，即
$\begin{aligned} y & \sim B(1,\phi)\Rightarrow p(y)=\left\{\begin{aligned}&\phi^{y}&y=1\\&(1-\phi)^{1-y}&y=0\end{aligned}$
因此，最大后验
$\begin{aligned} L (μ_{1}, μ_{2}, Σ, ϕ) & = \log \prod_{i = 1}^{N} [p (x_{i} | y_{i}) p (y_{i})] \\ = \sum_{i = 1}^{N} [\log p (x_{i} | y_{i}) + \log p (y_{i})] \\ = \sum_{i = 1}^{N} [\log N (μ_{1}, Σ)^{y_{i}} + \log N (μ_{2}, Σ)^{1 - y_{i}} + \log ϕ^{y_{i}} (1 - ϕ)^{1 - y_{i}}] \end{aligned}$

CSDN话题挑战赛第2期
参赛话题：学习笔记
相关阅读:
使用.Net对图片进行裁剪、缩放、与加水印
 Java web中，服务器运行不过来
 Java8Stream快速使用
 【Java接口性能优化】skywalking使用
 一审要求公开数据和代码问题请教
 2023-简单点-树莓派picamera2介绍和要点
 SQL语句大全--SQL
LeetCode【4. 寻找两个正序数组的中位数】
【ARMv9 DSU-120 系列 6.1 -- PPU power and reset control】
隐马尔可夫模型（HMM）
原文地址：https://blog.csdn.net/liu20020918zz/article/details/127134813