本文为8月20日计算机视觉理论学习笔记,分为三个章节:
基于图像的灰度特征计算灰度阈值,将图像中每个像素的灰度值与阈值相比较,最后将像素根据比较结果分到合适的类别中。

边缘:图像中两个不同区域的边界线上连续的像素点的集合,是图像局部特征不连续性的反映,体现了灰度、颜色、纹理、等特性的突变。

将图像按照相似性准则分成不同的区域。

2. 分水岭算法: 将在空间位置上相近并且灰度值相近的像素点互相连接起来构成一个封闭的轮廓。

首先将图像映射为带权无向图,图中每个节点对应于图像中的每个像素。每条边的权值表示相邻像素之间在灰度、颜色或纹理方面的非负相似度。

E
(
A
)
=
λ
⋅
R
(
A
)
+
B
(
A
)
R
(
A
)
=
∑
p
∈
p
R
p
(
A
p
)
B
(
A
)
=
∑
{
p
,
q
}
∈
N
B
{
p
,
q
}
⋅
δ
(
A
p
,
A
q
)
δ
(
A
p
,
A
q
)
=
{
1
i
f
A
p
≠
A
q
0
o
t
h
e
r
w
i
s
e
E(A) = \lambda \cdot R(A) + B(A)\\ R(A) = \sum_{p\in \mathbb{p} } R_p(A_p)\\ B(A) = \sum_{\{p, q\}\in \mathbb{N} } B_{\{p, q\}}\cdot \delta (A_p, A_q)\\ \delta (A_p, A_q) = \left\{
其中,
R
(
A
)
R(A)
R(A) 为区域项,
B
(
A
)
B(A)
B(A)为边界项。
R
R
R 是像素
p
p
p 分配标签
l
p
l_p
lp 的惩罚:

K-means 算法流程:
Grab Cuts 算法流程:

将多个强分类器连接在一起进行操作。每个强分类器都由若干个弱分类器加权组成。


▽ f ( x , y ) = [ G x , G y ] T = [ ∂ f ∂ x ∂ f ∂ y ] T \bigtriangledown f(x, y) = [G_x, G_y]^T = [\frac{\partial f}{\partial x} \frac{\partial f}{\partial y} ]^T ▽f(x,y)=[Gx,Gy]T=[∂x∂f∂y∂f]T
一组离散微分模板在将图像的梯度信息简单地计算出来:
{
G
x
(
x
,
y
)
=
H
(
x
+
1
,
y
)
−
H
(
x
−
1
,
y
)
G
y
(
x
,
y
)
=
H
(
x
,
y
+
1
)
−
H
(
x
,
y
−
1
)
\left\{


计算 Cell 的梯度方向直方图:
串接所有 Block 直方图:


3. 对比归一度:把各个 Cell 组合成空间上连通的区间 block,再归一。
行人的 HOG 特征如下:

正类和反类训练样本可用超平面完全正确地分开。

引入松弛变量 x x x 使得分类器在训练后仍可以存在一些错分样本,使得两类样本的间隔尽量大,同时使得错分的样本的松弛变量之和尽可能的小:
m
i
n
1
2
∣
∣
w
∣
∣
2
+
C
∑
i
ξ
i
s
t
.
y
i
(
w
⋅
x
i
+
b
)
≥
1
−
ξ
i
min\ \frac{1}{2}||w||^2 + C \sum_{i}\xi_i\\ st. \quad y_i(w\cdot x_i + b)\ge 1 - \xi_i
min 21∣∣w∣∣2+Ci∑ξist.yi(w⋅xi+b)≥1−ξi
其中,
x
x
x 为松弛变量,
x
i
≥
0
x_i \ge 0
xi≥0,
C
C
C 为大于零的折衷因子,调和间隔距离和错分样本数之间的关系。
包含一个 8×8 分辨率的跟滤波器(Root filter左),4×4 分辨率的组件滤波器(Part filter 中)。

