码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 数学基础(三)PCA原理与推导


    目录

    一、PCA数据压缩原理

    二、样本点中心化

    三、计算误差


    一、PCA数据压缩原理

    二、样本点中心化

            u向量的方向已经确定,我们将样本点映射到u向量上,显然右图的误差要比左图大许多,因此我们就需要先对样本进行中心化,使之分布于原点O附近。即计算所有样本点的均值(x的均值,y的均值),然后将每个样本点减去这个均值,就得到了中心化之后的样本。

    三、计算误差

    (注意:以下字母加粗表示向量)如下图所示,u为单位向量,表示映射的主方向,x为样本,pijx为x在u上的投影,我们要计算x投影在u上产生的误差e。

     样本x映射到u上产生的误差e为:

     

    这个式子可以从向量角度理解:我们要计算e,根据向量的加法原则(首尾相连),pijx+e=x。

    则得到 e=x-pijx。

    pijx即为x在u上的映射,我们表示为:\left \langle \vec{x},\vec{u} \right \rangle\vec{u}

    该公式转化成矩阵的形式如下图所示:

    e的模长即为损失的大小:

    下面的公式推导不难理解

    其中x,u为列向量,故x^Tu为一个实数,且x^Tu=u^Tx,不需要进行转置,且可以交换。

    得到损失为:

     \begin{Vmatrix} x \end{Vmatrix}^2是固定的,故想要损失降到最低,则需要使(x^Tu)^2最大。

    则如下图所示,其中x^Tu=u^Tx

    如果只有一个样本,则,直接求最大值。

    但此时有N个样本,那要怎么求最大值呢?

    将这N样本进行求和:

     

     我们令为X。

     这样我们的最大化目标就变为:

    我们使用拉格朗日条件极值计算最大值(条件为u^Tu=1):

    对u求导等于0得到:

    对λ求导等于0得到:

    满足这两个条件,即可求得最大值,求解n个 λ 和n个u的值,其中λ最大的那个值对应的方向就是最主要的方向,n维降到k维,保留几维就保留几个λ,即λ的个数等于k。

    注意:矩阵求偏导相关知识请见:

    矩阵求导、几种重要的矩阵及常用的矩阵求导公式_~青萍之末~的博客-CSDN博客_矩阵求导公式大全

  • 相关阅读:
    LeetCode每日一练 —— 160. 相交链表
    网络地图服务(WMS)详解
    【日常】一名开发人员总结的好习惯,欢迎补充
    iOS设备管理器iMazing比iTunes好用吗?有哪些优势
    Hadoop集群WordCount详解
    【python入门篇】元组、字典和集合(3)
    [OpenGL教程05 ] glAccum() 函数对累积缓存设置
    1.3 - 码制
    数据库级别的审计
    C语言 | Leetcode C语言题解之第141题环形链表
  • 原文地址:https://blog.csdn.net/m0_45447650/article/details/126214148
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号