吃瓜教程2|线性模型

“广义的线性模型”（generalized linear model），其中，g（*）称为联系函数（link function）。

想让同类样本点的投影点尽可能接近，不同类样本点投影之间尽可能远，即：让各类的协方差之和尽可能小，不用类之间中心的距离尽可能大。基于这样的考虑，LDA定义了两个散度矩阵。

Image Name

Image Name

因此得到了LDA的最大化目标：“广义瑞利商”（generalized Rayleigh quotient）。

Image Name

从而分类问题转化为最优化求解w的问题，当求解出w后，对新的样本进行分类时，只需将该样本点投影到这条直线上，根据与各个类别的中心值进行比较，从而判定出新样本与哪个类别距离最近。求解w的方法如下所示，使用的方法为λ乘子。

Image Name

若将w看做一个投影矩阵，类似PCA的思想，则LDA可将样本投影到N-1维空间（N为类簇数），投影的过程使用了类别信息（标记信息），因此LDA也常被视为一种经典的监督降维技术。

类别不平衡（class-imbanlance）就是指分类问题中不同类别的训练样本相差悬殊的情况，例如正例有900个，而反例只有100个，这个时候我们就需要进行相应的处理来平衡这个问题。常见的做法有三种：

相关阅读:
双11的大型电商活动服务器崩溃是怎么回事？
Spring Boot 文件上传与下载
Spring理解，重要概念及图解，2023秋招spring常见八股文
Pycharm一直打不开，无任何报错
Golang 递归获取目录下所有文件
入门力扣自学笔记121 C++ （题目编号1282）
后端统一处理返回前端日期LocalDateTime格式化去T，Long返回前端损失精度问题
Apache Bench多并发压测VFP猫框，它怎么能这样扛？
Google Earth Engine（GEE）——sentinel-2 NDVI多时相影像展示
oracle框架

原文地址：https://blog.csdn.net/weixin_44529258/article/details/133999777