• 【算法系列】卡尔曼滤波算法


    系列文章目录

    ·【算法系列】卡尔曼滤波算法

    ·【算法系列】非线性最小二乘求解-直接求解法

    ·【算法系列】非线性最小二乘求解-梯度下降法

    ·【算法系列】非线性最小二乘-高斯牛顿法 

    ·【算法系列】非线性最小二乘-列文伯格马夸尔和狗腿算法 

    文章目录

    系列文章

    文章目录

    前言

    一、通俗解释

    二、数学推导

    1.问题建模

    2.推导过程

    (1)数学准备

    (2)具体推导

    3.实际应用

    总结


    前言

    如果信号中的某些频段混入了噪声,可以用低通滤波器、高通滤波器等对这些噪声进行过滤,但当信号中要是混入了白噪声这种没有明显频率段的噪声,这种滤波器的效果将会大大下降,这时就需要采用统计学的方法对信号进行估计,同时采用某种统计准则来衡量估计的误差,使得误差尽可能小,这种滤波器叫现代滤波器,其中简洁、高效的当属卡尔曼滤波

    《麻省理工学院技术评论》在一篇纪念卡尔曼先生的文章中提到道:“卡尔曼最重要的发明是卡尔曼滤波算法,该算法成就了过去50年间的许多基本技术,如把阿波罗号宇航员送上月球的航天计算机系统、把人类送去探索深海和星球的机器人载体,以及几乎所有需要从噪声数据去估算实际状态的项目。有人甚至把包括环绕地球的卫星系统、卫星地面站及各类计算机系统在内的整个GPS系统统称为一个巨大无比的卡尔曼滤波器。”

    由此可见卡尔曼滤波在现代科学技术中的重要地位,而在SLAM中卡尔曼滤波也进行了广泛的应用,因此算法系列先讲一下卡尔曼滤波。

    一、通俗解释

    这个通俗解释是我在学习过程中偶然发现的文章,加上我的理解和解释,分享给大家。

    假设一辆在公路上行驶的汽车,起点位置A,下一秒汽车驶入林荫道中的B点,再下一秒汽车驶出林荫道来到C点,行驶到B点的密林中因为我们眼睛看不到,真实位置是需要估计的。

    这辆汽车上安装有IMU和GNSS(卫星)两种定位传感器。起点A的位置和速度假设是已知的,距离惯性坐标系X轴原点的距离为2m,速度为v_{t-1}

    当车辆驶入到B点时,一方面我们可以根据IMU测量得到汽车本体的三轴加速度和三轴角速度,结合初始速度v_{t-1},便可以计算得到B点相对于A点在X轴方向行驶距离的估计值,这里我们假设估计值为10m(在SLAM系统中,这就是通过状态方程中代入里程计或者IMU测得的状态量估计值)

    另一方面,通过GNSS我们可以直接测量出来B点的经纬度,通过坐标转换之后可以直接获得B点在X轴方向行驶的观测值,这里我们假设观测值为13m(在SLAM系统中,这就是通过观测方程代入激光雷达或相机数据测得的状态量估计值)

    问题来了,距离惯性坐标系点的距离现在有估计值(12m=10m+2m)和观测值(13m)两个值,且两个值不一致,我们该如何确定B点的准确估计值呢?

    众所周知,IMU测量汽车本体的加速度和角速度过程中,存在误差和噪声,GNSS通过卫星信号定位车辆经纬度的过程中也存在误差和噪声。

    两种传感器给出的值都是一种概率最大,意思是在这个位置的概率最大,其它位置不是不可能只是概率较小。

    而在卡尔曼滤波算法的理论中,无论是汽车上一秒的位置,IMU的测量数据,还是GNSS的直接观测值均被认为服从正态分布,服从正态分布的随机变量取与均值邻近的值的概率大,取与均值越远的值的概率越小,同时方差越小,分布越集中在均值附近,方差越大,分布越分散

    这里我们假设A点位置Xt-1服从N(2,0.22),如下图所示。从图中可以看出2m处纵坐标最大,概率最大,其它取值概率均小于此处。方差0.22则代表A点位置的误差水平。

    而对于IMU和GNSS这两种传感器来说,他们的噪声方差是可以测量的,在使用时是已知的,这里我们省略移动模型建模过程,直接假设基于IMU获得B点相对于A点的距离估计值XI服从N(10,0.12) ,方差0.12则代表IMU噪声的误差水平,此误差水平受IMU的精度,测量的累积时长有关。

    GNSS通过卫星信号获得B点相对于原点的测量值XG服从N(13,0.42) ,方差0.42代表GNSS噪声的误差水平,此误差水平一方面受GNSS里卫星板卡的精度水平,另一方面主要受所处的环境有关,是否有遮挡,是否多金属环境等。由于B点处于林荫道下,卫星信号时有时无,因此此时0.42的误差水平还是比较高的。

    现在我们有了两组数据,一组是B点相对于原点O的估计值XBOI = XI + XA = N(10,0.12) + N(2,0.22) = N(12,0.12 +0.22),一组是B点相对于原点O的观测值XG = N(13,0.42)。

    全文的高潮点来了,我该如何从两个概率分布中找到最准确的那个估计值呢,可以想象的是这个准确的估计值也遵从正态分布,这个正态分布的均值就是我们苦苦追寻的值。

    卡尔曼给出的答案是,直接将两个概率分布相乘,即N(12,0.12 +0.22) * N(13,0.42)。

    正态分布的乘法公式如上,将N(12,0.12 +0.22) * N(13,0.42)中的值带入下面公式,则可以得到如下正态分布。

    B点的(12.23,0.192)又将作为计算C点位置的初始值,重复上述过程。

    二、数学推导

    1.问题建模

    在很多实际问题中(如SLAM中估计机器人位姿),估计量不能通过直接测量得到,一般会用状态方程和观测方程来描述问题。

    x_{k}=g(x_{k-1},u_{k})+\varepsilon_{k}

    z_{k}=h(x_{k})+\delta_{k}

    状态方程描述的是上一个状态x_{k-1}在一定输入u_{k}(风力)的作用下到达当前时刻系统状态x_{k}的过程,当然这个过程肯定存在一定噪声\varepsilon_{k}(轮胎打滑)

    观测方程描述在当前时刻系统状态x_{k}下观测z_{k}(GPS观测)的过程,也存在一定噪声\delta_{k}(GPS信号干扰)

    这两个过程中的噪声都服从正态分布,假设\varepsilon_{k} \sim N(0,Q_{k}),\delta_{k} \sim N(0,R_{k})

    卡尔曼两遍只能处理线性系统,而这里的状态转移函数g和观测函数h往往是非线性函数,需要对其先进性线性化处理,一般线性化的方式都是泰勒展开,这个地方不具体讨论,展开后形式如下:

    x_{k}=A_{k}x_{k-1}+B_{k}u_{k}+\varepsilon _{k}

    z_{k}=C_{k}x_{k}+\delta _{k}

    2.推导过程

    (1)数学准备

    首先引入一些数学上的概念。

    协方差:cov(X,Y)=E[(X-E[X]])(Y-E[Y])]=\frac{\sum_{i=1}^{N}(x_{i}-\overline{X})(y_{i}-\overline{Y})}{N-1}

    当状态量为m维向量时,X=[X_{1},X_{2},...,X_{m}]^{T},这m个随机变量的协方差构成一个协方差矩阵P

    另外,我们经常用MSE(均方误差)来衡量估计的准确性,MSE由方差加一个偏差项构成,在无偏估计下MSE就等于方差,也就是可以用方差去描述准确性,这时协方差矩阵的迹tr(P)也等于MSE。

    另外还有一些矩阵求导的公式:\frac{d}{dA}[tr(AB)]=B^{T};\frac{d}{dA}[tr(ABA^{T})]=2AB

    (2)具体推导

    现在我们有了状态方程,已知上一个时刻状态和输入,以及系数,可以求出一个当前时刻状态的预测值(带噪声);有了观测方程,已知观测z_{k},可以反求出一个当前时刻状态的预测值(带噪声),观测偏差可以表示为\widetilde{z_{k}}=z_{k}-{\widehat{z_{k}}}'=z_{k}-C_{k}{\widehat{x_{k}}}'

    将这两种得到预测值的方式加权合并得到:\widehat{x_{k}}={\widehat{x_{k}}}'+K_{k}(z_{k}-C_{k}{\widehat{x_{k}}'})

    现在只需要求出权重K_{k}使得估计误差(MSE)最小就能求出比较准确的估计值,用到上面的结论,在无偏估计中,MSE=方差=tr(P),所以我们现在要求出来协方差矩阵的迹。

    {P_{k}}'=E[(x_{k}-{\widehat{x_{k}}}')(x_{k}-{\widehat{x_{k}}}')^{T}]

    P_{k}=E[(x_{k}-\widehat{x_{k}})(x_{k}-\widehat{x_{k}})^{T}]

    代入上面的\widehat{x_{k}}后整理可得:

    P_{k}={P_{k}}'-K_{k}C_{k}{P_{k}}'-(K_{k}C_{k}{P_{k}}')^{T}+K_{k}(C_{k}{P_{k}}'C_{k}^{T}+R_{k})K_{k}^{T}

     tr(P_{k})=tr({P_{k}}')-2tr(K_{k}C_{k}{P_{k}}')+tr(K_{k}(C_{k}{P_{k}}'C_{k}^{T}+R_{k})K_{k}^{T})

    将P的迹对K求导后等于0,即可求出取最小值时的K:

    \frac{d}{dK_{k}}[tr(P_{k})]=-2(C_{k}{P_{k}}')+2K_{k}(C_{k}P_{k}{C_{k}}'+R_{k})

    K_{k}={P_{k}}'C_{k}^{T}(C_{k}{P_{k}}'C_{k}^{T}+R_{k})^{-1}

    这个K_{k}称为卡尔曼增量,带入方程(后面两项消掉,第二项K_{k}不动):

    P_{k}=(I-K_{k}C_{k}){P_{k}}'

    再带入预测值后将{P_{k}}'整理一下:

    {P_{k}}'=A_{k}P_{k-1}A_{k}^{T}+Q_{k}

    3.实际应用

    总结来说卡尔曼滤波分为两个过程:预测和更新

    更新过程有两个核心公式:

    {\widehat{x_{k}}}'=A_{k}\widehat{x_{k-1}}+B_{k}u_{k}

    {P_{k}}'=A_{k}P_{k-1}A_{k}^{T}+Q_{k}

    更新过程有三个核心公式:

    K_{k}={P_{k}}'C_{k}^{T}(C_{k}{P_{k}}'C_{k}^{T}+R_{k})^{-1}

    \widehat{x_{k}}={\widehat{x_{k}}}'+K_{k}(z_{k}-C_{k}{\widehat{x_{k}}'})

    P_{k}=(I-K_{k}C_{k}){P_{k}}'


    总结

    最后公式推导可能有的公式只写了个结论,但其实也没用到很多数学知识,把上面的值带入,进行一些矩阵多项式展开,合并同类项就能得到结论,大家最好拿张纸自己推导一下,印象也能更深。

  • 相关阅读:
    Java核心知识:重写(Override)与重载(Overload)
    浅谈C++函数
    java毕业设计房屋中介管理Mybatis+系统+数据库+调试部署
    计算机网络的相关知识点总结
    Java 实现分布式定时任务
    数据结构全集介绍
    linux-定时任务
    运行软件后报错“未找到api-ms-win-core-com-l1-1-0.dll”
    ServiceStack.Redis的源码分析(连接与连接池)
    回归预测 | MATLAB实现MPA-BiGRU海洋捕食者算法优化双向门控循环单元多输入单输出回归预测(多指标,多图)
  • 原文地址:https://blog.csdn.net/qq_52785580/article/details/127803791