本系列博客包括6个专栏,分别为:《自动驾驶技术概览》、《自动驾驶汽车平台技术基础》、《自动驾驶汽车定位技术》、《自动驾驶汽车环境感知》、《自动驾驶汽车决策与控制》、《自动驾驶系统设计及应用》。
此专栏是关于《自动驾驶汽车决策与控制》书籍的笔记.
基本内容

无限时间状态的LQR调节器的设计过程
设线性系统的状态空间描述为:
{
x
˙
(
t
)
=
A
x
(
t
)
+
B
u
(
t
)
y
=
C
x
(
t
)
(3)
{˙x(t)=Ax(t)+Bu(t)y=Cx(t)
最优控制的关键是如何求得一组反馈控制序列
u
u
u,在时间段
[
t
0
,
∞
]
[t_0,\infty]
[t0,∞]内,该控制序列作为控制系统的输入,可以将控制系统由非平衡状态调节到零点(平衡状态)附近,同时能够使性能指标函数的值最小;
性能指标函数表示为
J
J
J,有:
J
=
1
2
∑
−
∞
∞
(
x
T
Q
x
+
u
T
R
u
)
d
t
(4)
J=\frac{1}{2}\sum_{-\infty}^{\infty}(x^TQx+u^TRu)dt\tag{4}
J=21−∞∑∞(xTQx+uTRu)dt(4)
其中:
u
u
u不受限制,
Q
Q
Q是半正定对称加权常数矩阵,
R
R
R是正定对称加权常数矩阵;
一般来说,
Q
Q
Q越大,系统达到稳态的时间越短,最优控制律为:
u
∗
=
−
R
−
1
B
T
P
x
(5)
u^*=-R^{-1}B^TPx\tag{5}
u∗=−R−1BTPx(5)
其中:
P
P
P为正定对称常数矩阵,且满足下列Riccati方程:
P
A
+
A
T
P
−
P
B
R
−
1
B
T
+
Q
=
0
(6)
PA+A^TP-PBR^{-1}B^T+Q=0\tag{6}
PA+ATP−PBR−1BT+Q=0(6)
利用MATLAB求解即可;
基本内容

模糊控制器各主要环节的功能
基本内容
自适应控制系统的设计过程
设可控系统的受控对象数学模型为:
{
x
˙
p
=
A
p
x
p
+
B
p
u
p
y
p
=
C
x
p
(7)
{˙xp=Apxp+Bpupyp=Cxp
其中:
x
p
x_p
xp为状态向量,
u
p
u_p
up为控制向量,
y
p
y_p
yp为输出向量,
A
p
、
B
p
、
C
A_p、B_p、C
Ap、Bp、C分别为相同维数的系数矩阵;
选定参考模型时,通常使其具有与被控对象相同的结构形式,参数根据系统设计要求确定,参考模型表示为:
{
x
˙
m
=
A
m
x
m
+
B
m
r
m
y
m
=
C
x
m
(8)
{˙xm=Amxm+Bmrmym=Cxm
其中:
x
m
x_m
xm为参考模型的状态向量,
y
m
y_m
ym为参考模型的输出向量,
r
m
r_m
rm为参考模型的输入向量,
A
m
、
B
m
A_m、B_m
Am、Bm分别是有相同维数的表示期望性能的系数矩阵;
系统的广义输出误差方程为:
ε
=
y
m
−
y
p
(9)
\varepsilon=y_m-y_p\tag{9}
ε=ym−yp(9)
其中:
y
m
y_m
ym为模型的输出量,
y
p
y_p
yp为可调系统的输出量;
系统的广义状态误差方程为:
e
=
x
m
−
x
p
(10)
e=x_m-x_p\tag{10}
e=xm−xp(10)
广义误差运动方程为:
e
˙
(
t
)
=
A
m
e
+
(
A
m
−
A
p
)
x
p
+
B
m
r
m
−
B
p
u
p
(11)
\dot{e}(t)=A_me+(A_m-A_p)x_p+B_mr_m-B_pu_p\tag{11}
e˙(t)=Ame+(Am−Ap)xp+Bmrm−Bpup(11)
自适应控制需要使等效误差的解
ε
\varepsilon
ε和
e
e
e尽可能小;
神经网络控制:指应用神经网络技术,对控制系统中难以精确建模的复杂非线性对象进行神经网络模型辨识,可以作为控制器,可以对参数进行优化设计,可以进行推理,可以进行故障诊断;
通常神经网络直接作为误差闭环系统的反馈控制器,神经网络控制器先利用其已有的控制样本离线训练,后以系统误差的均方差为评价函数进行在线学习;
神经网络控制器如下图所示:

常见的神经网络控制结构: