• LK光流法和LK金字塔光流法(含python和c++代码示例)


    0 引言

    本文主要记录LK光流算法LK金字塔光流算法的详细原理,最后还调用OpenCV中的cv2.calcOpticalFlowPyrLK()函数实现LK金字塔光流算法,其中第3部分是python语言实现版本,第4部分是c++语言实现版本。

    1 LK光流算法

    1.1 简述

    LK光流法是一种计算图像序列中物体运动的光流(optical flow)的经典算法。它是由Bruce D. LucasTakeo Kanade1981年提出的,被广泛应用于计算机视觉和图像处理领域。

    光流是指图像中物体在时间上的运动造成的像素强度变化。光流法的目标是通过分析图像序列中相邻帧之间的像素强度变化来估计物体的运动状况LK光流法基于以下三个基本假设

    1. 亮度恒定假设:假设相邻帧中的像素在时间上的变化主要由物体的运动引起,而不是由光照变化或物体的颜色变化引起。这意味着在物体的运动下,相邻帧中对应的像素强度值应该保持不变;
    2. 小运动假设:假设物体在相邻帧之间的运动是较小的,即相邻帧之间的像素位移较小。这个假设使得可以使用局部近似的方法来估计光流;
    3. 空间一致性:场景中相同表面的相邻点具有相似的运动,并且其投影到图像平面上的距离也比较近。(LK算法特有)

    1.2 原理推导

    首先基于亮度恒定假设小运动假设,设 t t t时刻,位于 ( x , y ) (x,y) (x,y)像素位置的物体,且在 t + Δ t t+\Delta _t t+Δt时刻位于 ( x + u , y + v ) (x+u,y+v) (x+u,y+v)位置,则有:

    I ( x , y , t ) = I ( x + u , y + v , t + Δ t ) (1) I(x,y,t)=I(x+u,y+v,t+\Delta _t) \tag{1} I(x,y,t)=I(x+u,y+v,t+Δt)(1)

    将等式右边进行一阶泰勒展开得:

    I ( x + u , y + v , t + Δ t ) = I ( x , y , t ) + I x ′ u + I y ′ v + I t ′ Δ t (2) I(x+u,y+v,t+\Delta _t)=I(x,y,t)+I{}'_xu+I{}'_yv+I{}'_t\Delta _t \tag{2} I(x+u,y+v,t+Δt)=I(x,y,t)+Ixu+Iyv+ItΔt(2)

    结合公式1公式2,得出:

    I ( x , y , t ) = I ( x , y , t ) + I x ′ u + I y ′ v + I t ′ Δ t (3) I(x,y,t)=I(x,y,t)+I{}'_xu+I{}'_yv+I{}'_t\Delta _t \tag{3} I(x,y,t)=I(x,y,t)+Ixu+Iyv+ItΔt(3)

    即:

    I x ′ u + I y ′ v + I t ′ Δ t = 0 (4) I{}'_xu+I{}'_yv+I{}'_t\Delta _t=0 \tag{4} Ixu+Iyv+ItΔt=0(4)

    公式4写成矩阵形式

    [ I x ′ + I y ′ ] [ u v ] = − I t ′ Δ t = − Δ I t (5)

    [Ix+Iy]" role="presentation">[Ix+Iy]
    [uv]" role="presentation">[uv]
    =-I{}'_t\Delta _t=-\Delta I_t \tag{5} [Ix+Iy][uv]=ItΔt=ΔIt(5)

    其中, I x ′ , I y ′ I{}'_x,I{}'_y Ix,Iy分别为 ( x , y ) (x,y) (x,y)像素点处图像亮度在 x x x方向和 y y y方向的偏导数

    I t ′ I{}'_t It t t t时刻, ( x , y ) (x,y) (x,y)处像素亮度对时间的导数

    I t ′ Δ t I{}'_t\Delta _t ItΔt为两图之间的 ( x , y ) (x,y) (x,y)坐标位置的亮度差,表示为 Δ I t = I t ′ Δ t \Delta I_t=I{}'_t\Delta _t ΔIt=ItΔt

    给定两张图片, I x ′ , I y ′ , Δ I t I{}'_x,I{}'_y,\Delta I_t Ix,Iy,ΔIt是已知量, u , v u,v u,v即是待求的光流,但仅凭公式5一个等式求解两个未知数 u , v u,v uv暂时无法得到唯一解

    所以还需借助第三个假设-空间一致性,假设在一个大小为 m × m ( n = m 2 ) m\times m(n=m^2) m×m(n=m2)的窗口内,图像的光流是一个恒定值,可得:

    I x 1 u + I y 1 v = − I t 1 I x 2 u + I y 2 v = − I t 2 ⋯ I x n u + I y n v = − I t n (6)

    Ix1u+Iy1v=It1Ix2u+Iy2v=It2Ixnu+Iynv=Itn" role="presentation">Ix1u+Iy1v=It1Ix2u+Iy2v=It2Ixnu+Iynv=Itn
    \tag{6} Ix1u+Iy1v=It1Ix2u+Iy2v=It2Ixnu+Iynv=Itn(6)

    矩阵形式表示为:

    [ I x 1 + I y 1 I x 2 + I y 2 ⋮ I x n + I y n ] [ u v ] = [

  • 相关阅读:
    解决了个bug,想说点啥但又难以启齿
    freertos 内部机制
    马上消费金融CIO蒋宁:拨云见日,金融行业大模型落地三大真核技术
    maven打完包运行,测试结果和本地不一致
    JavaSE---LinkedList与链表
    Yolov7实战,实现网页端的实时目标检测
    docker学习笔记
    实现Traefik工具Dashboard远程访问:搭建便捷的远程管理平台
    debian安装portainer
    作业11:优化算法比较
  • 原文地址:https://blog.csdn.net/MRZHUGH/article/details/133995312