本文主要记录LK
光流算法及LK
金字塔光流算法的详细原理,最后还调用OpenCV
中的cv2.calcOpticalFlowPyrLK()
函数实现LK
金字塔光流算法,其中第3
部分是python
语言实现版本,第4
部分是c++
语言实现版本。
LK
光流法是一种计算图像序列中物体运动的光流(optical flow
)的经典算法。它是由Bruce D. Lucas
和Takeo Kanade
在1981
年提出的,被广泛应用于计算机视觉和图像处理领域。
光流是指图像中物体在时间上的运动造成的像素强度变化。光流法的目标是通过分析图像序列中相邻帧之间的像素强度变化来估计物体的运动状况。LK
光流法基于以下三个基本假设:
LK
算法特有)首先基于亮度恒定假设和小运动假设,设 t t t时刻,位于 ( x , y ) (x,y) (x,y)像素位置的物体,且在 t + Δ t t+\Delta _t t+Δt时刻位于 ( x + u , y + v ) (x+u,y+v) (x+u,y+v)位置,则有:
I ( x , y , t ) = I ( x + u , y + v , t + Δ t ) (1) I(x,y,t)=I(x+u,y+v,t+\Delta _t) \tag{1} I(x,y,t)=I(x+u,y+v,t+Δt)(1)
将等式右边进行一阶泰勒展开得:
I ( x + u , y + v , t + Δ t ) = I ( x , y , t ) + I x ′ u + I y ′ v + I t ′ Δ t (2) I(x+u,y+v,t+\Delta _t)=I(x,y,t)+I{}'_xu+I{}'_yv+I{}'_t\Delta _t \tag{2} I(x+u,y+v,t+Δt)=I(x,y,t)+Ix′u+Iy′v+It′Δt(2)
结合公式1
和公式2
,得出:
I ( x , y , t ) = I ( x , y , t ) + I x ′ u + I y ′ v + I t ′ Δ t (3) I(x,y,t)=I(x,y,t)+I{}'_xu+I{}'_yv+I{}'_t\Delta _t \tag{3} I(x,y,t)=I(x,y,t)+Ix′u+Iy′v+It′Δt(3)
即:
I x ′ u + I y ′ v + I t ′ Δ t = 0 (4) I{}'_xu+I{}'_yv+I{}'_t\Delta _t=0 \tag{4} Ix′u+Iy′v+It′Δt=0(4)
公式4
写成矩阵形式:
[ I x ′ + I y ′ ] [ u v ] = − I t ′ Δ t = − Δ I t (5)
其中, I x ′ , I y ′ I{}'_x,I{}'_y Ix′,Iy′分别为 ( x , y ) (x,y) (x,y)像素点处图像亮度在 x x x方向和 y y y方向的偏导数;
I t ′ I{}'_t It′为 t t t时刻, ( x , y ) (x,y) (x,y)处像素亮度对时间的导数;
I t ′ Δ t I{}'_t\Delta _t It′Δt为两图之间的 ( x , y ) (x,y) (x,y)坐标位置的亮度差,表示为 Δ I t = I t ′ Δ t \Delta I_t=I{}'_t\Delta _t ΔIt=It′Δt
给定两张图片, I x ′ , I y ′ , Δ I t I{}'_x,I{}'_y,\Delta I_t Ix′,Iy′,ΔIt是已知量, u , v u,v u,v即是待求的光流,但仅凭公式5
一个等式求解两个未知数 u , v u,v u,v,暂时无法得到唯一解。
所以还需借助第三个假设-空间一致性,假设在一个大小为 m × m ( n = m 2 ) m\times m(n=m^2) m×m(n=m2)的窗口内,图像的光流是一个恒定值,可得:
I x 1 u + I y 1 v = − I t 1 I x 2 u + I y 2 v = − I t 2 ⋯ I x n u + I y n v = − I t n (6)
用矩阵形式表示为:
[ I x 1 + I y 1 I x 2 + I y 2 ⋮ I x n + I y n ] [ u v ] = [