• 数学建模十大算法02—插值与拟合(拉格朗日插值、三次样条插值、线性最小二乘法……)


    引入

    插值: 求过已知有限个数据点的近似函数。(强调这个近似函数要过所有已知点)
    拟合: 已知有限个数据点,求近似函数,可不过已知数据点,只要求在某种意义下它在这些点上的总偏差最小。
    插值和拟合都是要根据一组数据构造一个函数作为近似,由于近似的要求不同,二者的数学方法上是完全不同的。 而面对一个实际问题,究竟应该用插值还是拟合,有时容易确定,有时则并不明显。

    一、插值

    在工程和数学应用中,经常有这样一类数据处理问题,在平面上给定一组离散点列,要求一条曲线,把这些点按次序连接起来,称为插值

    我们为什么要进行插值呢?
    我们进行数据处理的理想,当然是希望数据非常的完备,啥玩意儿都有。但现实往往不尽如人意,数据经常会缺东少西的,那怎么办呢?

    我们需要对一些不存在的数据进行一些插补。比如,我们分析某个餐馆在一段时间内的营收情况,但某一天收银系统出问题了,这天都是手工收款入账的,我们的系统里面就没有这一天的营收数据。那怎么办呢?我们就需要根据一定的办法把这天的营收数据给找补回来,那怎么找补呢?常用的方法有:
    在这里插入图片描述
    已知 n + 1 n+1 n+1 个点 ( x i , y i ) \left(x_{i}, y_{i}\right) (xi,yi) ( i = 0 , 1 , . . . , n ) (i=0,1,...,n) (i=0,1,...,n),下面求各种插值函数。

    1.1 分段线性插值

    简单地说,将每两个相邻的节点用直线连起来,如此形成的一条折线就是分段线性插值函数。计算 x x x点的插值时,只用到 x x x左右的两个节点,计算量与节点个数 n n n无关。但 n n n越大,分段越多,插值误差越小。
    假设两个节点为 ( x 1 , y 1 ) ( x 2 , y 2 ) \left(x_{1}, y_{1}\right)\left(x_{2}, y_{2}\right) (x1,y1)(x2,y2),则该区间上的一次线性方程为:
    在这里插入图片描述
    其证明过程非常简单:
    在这里插入图片描述
    在这里插入图片描述
    以上就是分段线性插值的原理,可以看出原理十分简单。分段线性插值运算量较小,插值误差较小,插值函数具有连续性,但是由于在已知点的斜率是不变的,所以导致插值结果不光滑,存在角点。

    该方法可用matlab自带的interp1函数实现。

    x = 0:10;  % 已知x值
    y = x.*sin(x);  % 已知y值(表达式)
    x1 = 0:0.25:10;   % 要求的插值点
    y1 = interp1(x,y,x1);  % 用一维插值方法求出的值,默认method为linear
    plot(x,y,'k*',x1,y1)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    其运行的结果如下所示:
    在这里插入图片描述

    实际上用函数表作插值计算时,分段线性插值就足够了,如数学、物理中用的特殊函数表,数理统计中用的概率分布表等。

    1.2 牛顿插值法

    首先我们要知道牛顿多项式的形式: N n ( x ) = a 0 + a 1 ( x − x 0 ) + a 2 ( x − x 0 ) ( x − x 1 ) + ⋯ + a n ( x − x 0 ) ( x − x 1 ) ⋯ ( x − x n − 1 ) \mathrm{N}_{\mathrm{n}}(\mathrm{x})=\mathrm{a}_0+\mathrm{a}_1\left(\mathrm{x}-\mathrm{x}_0\right)+\mathrm{a}_2\left(\mathrm{x}-\mathrm{x}_0\right)\left(\mathrm{x}-\mathrm{x}_1\right)+\cdots+\mathrm{a}_{\mathrm{n}}\left(\mathrm{x}-\mathrm{x}_0\right)\left(\mathrm{x}-\mathrm{x}_1\right) \cdots\left(\mathrm{x}-\mathrm{x}_{\mathrm{n}-1}\right) Nn(x)=a0+a1(xx0)+a2(xx0)(xx1)++an(xx0)(xx1)(xxn1)
    其中 a k ( k = 0 , 1 , . . . , n ) a_k (k=0,1,...,n) ak(k=0,1,...,n)为待定系数。

    自变量之差与因变量之差之比叫差商

    定义: 函数 y = f ( x ) \mathrm{y}=\mathrm{f}(\mathrm{x}) y=f(x) 在区间 [ x i , x i + 1 ] \left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}\right] [xi,xi+1] 上的平均变化率
    f [ x i , x i + 1 ] = f ( x i + 1 ) − f ( x i ) x i + 1 − x i \mathrm{f}\left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}\right]=\frac{\mathrm{f}\left(\mathrm{x}_{\mathrm{i}+1}\right)-\mathrm{f}\left(\mathrm{x}_{\mathrm{i}}\right)}{\mathrm{x}_{\mathrm{i}+1}-\mathrm{x}_{\mathrm{i}}} f[xi,xi+1]=xi+1xif(xi+1)f(xi)
    称为 f ( x ) f(x) f(x) 关于 x i , x i + 1 x_i, x_{i+1} xi,xi+1一阶差商,并记为 f [ x i , x i + 1 ] f\left[x_i, x_{i+1}\right] f[xi,xi+1]

    二阶差商
    f [ x i , x i + 1 , x i + 2 ] = f [ x i + 1 , x i + 2 ] − f [ x i , x i + 1 ] x i + 2 − x i \mathrm{f}\left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}, \mathrm{x}_{\mathrm{i}+2}\right]=\frac{\mathrm{f}\left[\mathrm{x}_{\mathrm{i}+1}, \mathrm{x}_{\mathrm{i}+2}\right]-\mathrm{f}\left[\mathrm{x}_{\mathrm{i}}, \mathrm{x}_{\mathrm{i}+1}\right]}{\mathrm{x}_{\mathrm{i}+2}-\mathrm{x}_{\mathrm{i}}} f[xi,xi+1,xi+2]=xi+2xif[xi+1,xi+2]f[xi,xi+1]
    m \mathrm{m} m 阶差商
    f [ x 0 , x 1 , ⋯   , x m ] = f [ x 1 , x 2 , ⋯   , x m ] − f [ x 0 , x 1 , ⋯   , x m − 1 ] x m − x 0 \mathrm{f}\left[\mathrm{x}_0, \mathrm{x}_1, \cdots, \mathrm{x}_{\mathrm{m}}\right]=\frac{\mathrm{f}\left[\mathrm{x}_1, \mathrm{x}_2, \cdots, \mathrm{x}_{\mathrm{m}}\right]-\mathrm{f}\left[\mathrm{x}_0, \mathrm{x}_1, \cdots, \mathrm{x}_{\mathrm{m}-1}\right]}{\mathrm{x}_{\mathrm{m}}-\mathrm{x}_0} f[x0,x1,,xm]=xmx0f[x1,x2,,xm]f[x0,x1,,xm1]

    那么,牛顿插值公式为:
    在这里插入图片描述

    更多细节请参考:数值分析(一) 牛顿插值法及matlab代码

    1.3 拉格朗日插值多项式

    举个简单的例子,比如说,已知下面这几个点,我想找一根穿过它们的曲线:
    在这里插入图片描述
    我们可以合理的假设,这根曲线是一个二次多项式:
    在这里插入图片描述
    这是因为有三个已知的点,可以通过下列方程组解出这个二次多项式:
    在这里插入图片描述
    不过这里不打算通过解方程来得到这根二次曲线,如果已知的点有很多,那我们需要解的方程组会很复杂,因此我们来看看拉格朗日是怎么巧妙解出这根曲线的?

    首先,第一根曲线 f 1 ( x ) f_1(x) f1(x),在 x 1 x_1 x1 点处,取值为1,其余两点取值为0:
    在这里插入图片描述
    第二根曲线 f 2 ( x ) f_2(x) f2(x),在 x 2 x_2 x2 点处,取值为1,其余两点取值为0:
    在这里插入图片描述
    第三根曲线 f 3 ( x ) f_3(x) f3(x),在 x 3 x_3 x3 点处,取值为1,其余两点取值为0:
    在这里插入图片描述
    这三根曲线就是拉格朗日需要的,我们来看看为什么?
    在这里插入图片描述
    那么 f ( x ) = y 1 f 1 ( x ) + y 2 f 2 ( x ) + y 3 f 3 ( x ) f(x) = y_1f_1(x) + y_2f_2(x) + y_3f_3(x) f(x)=y1f1(x)+y2f2(x)+y3f3(x) 这个方程就可以经过已知的三个点。

    就可以穿过这三个点,用一个动图直观理解下:
    在这里插入图片描述
    最终得到的曲线就是拉格朗日找到的曲线:
    在这里插入图片描述
    用严格的数学表达来理解拉格朗日插值法,过程如下:

    拉格朗日(Lagrange)插值的基函数为: l i ( x ) = ( x − x 0 ) ⋯ ( x − x i − 1 ) ( x − x i + 1 ) ⋯ ( x − x n ) ( x i − x 0 ) ⋯ ( x i − x i − 1 ) ( x i − x i + 1 ) ⋯ ( x i − x n ) = ∏ j = 0 j ≠ i n x − x j x i − x j , i = 0 , 1 , ⋯   , n ∘

    li(x)=(xx0)(xxi1)(xxi+1)(xxn)(xix0)(xixi1)(xixi+1)(xixn)=j=0jinxxjxixj,i=0,1,,n" role="presentation" style="position: relative;">li(x)=(xx0)(xxi1)(xxi+1)(xxn)(xix0)(xixi1)(xixi+1)(xixn)=j=0jinxxjxixj,i=0,1,,n
    li(x)=(xix0)(xixi1)(xixi+1)(xixn)(xx0)(xxi1)(xxi+1)(xxn)=j=0j=inxixjxxj,i=0,1,,n
    l i ( x ) l_{i}(x) li(x) n n n次多项式,满足
    l i ( x j ) = { 0 , j ≠ i 1 , j = i ∘ l_i\left(x_j\right)=\left\{
    0,ji1,j=i" role="presentation" style="position: relative;">0,ji1,j=i
    \right.
    li(xj)={0,j=i1,j=i

    拉格朗日插值函数为:
    L n ( x ) = ∑ i = 0 n y i l i ( x ) = ∑ i = 0 n y i ( ∏ j = 0 j ≠ i n x − x j x i − x j ) L_n(x)=\sum_{i=0}^n y_i l_i(x)=\sum_{i=0}^n y_i\left(\prod_{\substack{j=0 \\ j \neq i}}^n \frac{x-x_j}{x_i-x_j}\right) Ln(x)=i=0nyili(x)=i=0nyi j=0j=inxixjxxj
    我们可以将给定的 n + 1 n+1 n+1 个点带入拉格朗日基本多项式(插值基函数),发现当且仅当 i = j i=j i=j 时取1,其余情况取0,这样就保证了 L L L 经过这 n + 1 n+1 n+1 个点。

    matlab代码如下:

    function y0=Lagrange(x,y,x0)
    n=length(x);
    l=ones(1,n);
    y0=0;
    for j=1:n
        for k=1:n
            if j~=k  % j≠k时
               l(j)=l(j)*(x0-x(k))/(x(j)-x(k));
            end
        end
    end
    for i=1:n
        y0=y0+l(i)*y(i);
    end
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    1.4 样条插值

    许多工程技术中提出的计算问题对插值函数的光滑性有较高要求,如飞机的机翼外形,内燃机的进、排气门的凸轮曲线,都要求曲线具有较高的光滑程度,不仅要连续,而且要有连续的曲率,这就导致了样条插值的产生。

    样条(Spline) 本来是工程设计中使用的一种绘图工具,是富有弹性的细木条或细金属条。绘图员利用它把一些已知点连接成一条光滑曲线(称为样条曲线),并使连接点处有连续的曲率。三次样条插值就是由此抽象而来的。

    简单来说,样条插值就是根据每两个相邻的数据点确定一段函数,然后再结合成一个函数,那么就是光滑的函数了。
    在这里插入图片描述
    数学上将具有一定光滑性的分段多项式称为样条函数。具体地说,给定区间[a,b]的一个分划:
    在这里插入图片描述
    如果函数 S ( x ) S(x) S(x) 满足:
    在这里插入图片描述

    1.4.1 三次样条插值

    利用样条函数进行插值,即取插值函数为样条函数,称为样条插值。例如分段线性插值是一次样条插值。这里只介绍三次样条插值,即已知函数 y = f ( x ) y=f(x) y=f(x) 在区间 [ a , b ] [a,b] [a,b] 上的 n + 1 n+1 n+1 个节点 a = x 0 < x 1 < ⋯ < x n − 1 < x n = b a=x_0a=x0<x1<<xn1<xn=b 上的值 y i = f ( x i ) ( i = 0 , 1... , n ) y_i = f(x_i) (i=0,1...,n) yi=f(xi)(i=0,1...,n) ,求插值函数 S ( x ) S(x) S(x) ,使得:
    在这里插入图片描述
    在这里插入图片描述
    Matlab中三次样条插值有如下函数:

    y = interp1(xdata,ydata,x,'spline');
    y = spline(xdata,ydata,x);
    pp = csape(x0,y0,conds); y = fnval(pp,x);
    pp = csape(x0,y0,conds,valconds); y = fnval(pp,x);
    
    • 1
    • 2
    • 3
    • 4

    pp = csape(x0,y0)使用默认的边界条件,即Lagrange边界条件。

    pp = csape(x0,y0,conds,valconds)中的conds的指定插值的边界条件,其值可为:

    • ‘complete’ 边界为一阶导数,一阶导数的值在valconds参数中给出,若忽略valconds参数视为默认情况。
    • 'second’边界为二阶导数,二阶导数的值在参数valconds中给出,不使用参数valconds,默认值为[0,0]。
      在这里插入图片描述
    1.5 二维插值

    前面讲述的都是一维插值,即节点为一维变量,插值函数是一元函数(曲线)。若节点是二维的,插值函数就是二元函数,即曲面。 如在某区域测量了若干点(节点)的高程(节点值),为了画出较精确的等高线图,就要先插入更多的点(插值点),计算这些点的高程(插值)。

    1.5.1 插值节点为网格节点

    在这里插入图片描述
    Matlab中计算二维插值的命令如下:

    z = interp2(x0,y0,z0,x,y,'method')
    
    • 1

    其中: x 0 x_0 x0, y 0 y_0 y0 分别为 m m m 维和 n n n 维向量,表示节点; z 0 z_0 z0 n × m n×m n×m 矩阵,表示节点值; x x x, y y y 为一维数组,表示插值点, x x x y y y应是方向不同的向量,即一个是行向量,另一个是列向量; z z z为矩阵,它的行数为 y y y的维数,列数为 x x x的维数,表示得到的插值;'method’的用法同上面的一维插值。
    在这里插入图片描述

    【例】 测得平板表面3×5网格点处的温度分别为:
    在这里插入图片描述

    试作出平板表面温度分布曲面 z = f ( x , y ) z=f(x,y) z=f(x,y)的图形。

    第一步:先在三维坐标画出原始数据,画出粗糙的温度分布曲面。

    x=1:5;
    y=1:3;
    temps=[82 81 80 82 84;79 63 61 65 81;84 84 82 85 86];
    mesh(x,y,temps)  % 构建空间曲面图(mesh画的是曲线网格图,surf画的是曲面网格图)
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    第二步:以平滑数据,在x、y方向上每隔0.2个单位的地方进行插值。

    xi=1:0.2:5;
    yi=1:0.2:3;
    zi=interp2(x,y,temps,xi',yi,'cubic');  % 注意这里x和y形状不一样,任意一个作为行向量,另一个作为列向量
    mesh(xi,yi,zi)
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述
    contour(xi,yi,zi,20,'r')作其等高线图(等高线图:z值一样的点连起来的图)如下:

    在这里插入图片描述
    如果是三次样条插值,可以使用命令:

    pp = csape({x0,y0},z0,conds,valconds);
    z = fnval(pp,{x,y});
    
    • 1
    • 2

    其中: x 0 x_0 x0, y 0 y_0 y0 分别为 m m m 维和 n n n 维向量; z 0 z_0 z0 m × n m×n m×n 矩阵; z z z为矩阵,它的行数为 x x x的维数,列数为 y y y的维数,表示得到的插值,具体使用方法同一维插值。

    1.5.2 插值节点为散乱节点

    在这里插入图片描述
    注意此时已知的是n个节点,和1.5.1的m×n个节点情况不同。

    对上述问题,Matlab中提供了插值函数griddata,其格式为:

    ZI = griddata(x,y,z,XI,YI);
    
    • 1

    【例】 在某海域测得一些点 ( x , y ) (x,y) (x,y)处的水深z由下表给出,船的吃水深度为5英尺,在矩形区域 ( 75 , 200 ) × ( − 50 , 150 ) (75,200) ×(-50,150) (75200)×(50150) 里的哪些地方船要避免进入。在矩形区域内画出海底曲面的图形。
    在这里插入图片描述
    由题意得,船的吃水深度小于5米时,船比较容易搁浅。

    x=[129 140 103.5 88 185.5 195 105 157.5 107.5 77 81 162 162 117.5];
    y=[7.5 141.5 23 147 22.5 137.5 85.5 -6.5 -81 3 56.5 -66.5 84 -33.5];
    z=[-4 -8 -6 -8 -6 -8 -8 -9 -9 -8 -8 -9 -4 -9];
    cx=75:0.5:200;  % 矩形区域
    cy=-50:0.5:150;
    cz=griddata(x,y,z,cx,cy','cubic');  % 采用立方插值在矩形区域内做二维插值
    figure(1),meshz(cx,cy,cz);  % 海底曲线图
    xlabel('X'),ylabel('Y'),zlabel('Z');
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述

    figure(2),contour(cx,cy,cz,[-5 -5],'r');  % 画出深度为5米的等高线,则在等高线内部的深度均小于5米
    grid; 
    hold on;
    plot(x,y,'+');  % 二维坐标中标出数据各个点位置
    xlabel('X'),ylabel('Y');
    
    • 1
    • 2
    • 3
    • 4
    • 5

    在这里插入图片描述
    红色曲线内部的点都是船比较容易搁浅的位置。

    1.6 例题

    【例】机床加工。 待加工零件的外形根据工艺要求由一组数据 ( x , y ) (x,y) (x,y) 给出(在平面情况下),用程控铣床加工时每一刀只能沿 x x x 方向和 y y y 方向走非常小的一步,这就需要从已知数据得到加工所要求的步长很小的 ( x , y ) (x,y) (x,y) 坐标。
    表5.1中给出的 x , y x,y x,y 数据位于机翼断面的下轮廓线上,假设需要得到 x x x 坐标每改变0.1时的 y y y 坐标。试完成加工所需数据,画出曲线,要求用最近项插值、分段线性插值和三次样条插值(不同边界)方法计算。
    在这里插入图片描述
    Matlab代码如下:

    x0=[0 3 5 7 9 11 12 13 14 15];
    y0=[0 1.2 1.7 2.0 2.1 2.0 1.8 1.2 1.0 1.6];
    x=0:0.1:15;
    % ------最近项插值
    y1 = interp1(x0,y0,x,'nearest');
    subplot(1,5,1)
    plot(x0,y0,'+',x,y1);
    title('nearest method');
    % ------ 线性插值
    y2 = interp1(x0,y0,x); 
    subplot(1,5,2)
    plot(x0,y0,'+',x,y2);
    title('Piecewise linear');
    % ------立方样条插值
    y3 = interp1(x0,y0,x,'spline');
    subplot(1,5,3)
    plot(x0,y0,'+',x,y3)
    title('Splinel')
    % ------三次样条插值的Lagrange边界条件
    pp1 = csape(x0,y0);
    y4 = fnval(pp1,x);
    subplot(1,5,4)
    plot(x0,y0,'+',x,y4)
    title('Spline2')
    % ------指定插值边界条件为二阶导数
    pp2 = csape(x0,y0,'second');
    y5 = fnval(pp2,x);  % 使用fnval函数求插值点的函数值
    subplot(1,5,5)
    plot(x0,y0,'+',x,y5);
    title('Spline3')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30

    其运行结果为:
    在这里插入图片描述
    我们可以明显感觉到,三次样条插值得到的曲线会更加平滑。

    【例】 在某山区测得一些地点的高程如下表。平面区域为 1200 ≤ x ≤ 4000 , 1200 ≤ y < 3600 1200≤x≤4000, 1200≤y<3600 1200x4000,1200y<3600,试用Matlab中的最邻近插值、双线性插值和双三次插值3种方法作出该山区的地貌图和等高线图,并求出最高和最低点,并对几种插值方法进行比较。
    在这里插入图片描述
    首先,第一步我们做出已知点的网格面。

    x=1200:400:4000;
    y=1200:400:3600;
    [xx,yy]=meshgrid(x,y);  % xx是以x为行(列数为向量x的长度)的矩阵,yy是以y为列(行数为y的长度)的矩阵。[xx,yy]矩阵x和矩阵y合在一起
    z=[1130 1250 1280 1230 1040 900 500 700; 1320 1450 1420 1400 1300 700 900 850; 
        1390 1500 1500 1400 900 1100 1060 950; 1500 1200 1100 1350 1450 1200 1150 1010;
        1500 1200 1100 1550 1600 1550 1380 1070; 1500 1550 1600 1550 1600 1600 1600 1550; 
        1480 1500 1550 1510 1430 1300 1200 980];
    figure(1);
    meshz(x,y,z)
    xlabel('X'),ylabel('Y'),zlabel('Z')
    title('网格面')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    在这里插入图片描述
    然后,我们用最邻近插值法看一下插值结果:

    xi=1200:40:4000;
    yi=1200:40:3600;
    figure(2)
    z1i=interp2(x,y,z,xi,yi','nearest');
    subplot(1,2,1),surfc(xi,yi,z1i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('最邻近插值');
    subplot(1,2,2),contour(xi,yi,z1i,10,'r'),title('最邻近插值等高线图');
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    在这里插入图片描述
    同样,看一下线性插值法及其等高线图。

    figure(3)
    z2i=interp2(x,y,z,xi,yi','linear');
    subplot(1,2,1),surfc(xi,yi,z2i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('线性插值');
    subplot(1,2,2),contour(xi,yi,z2i,10,'r'),title('线性插值等高线图');
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述
    立方插值法及其等高线图:

    figure(4)
    z3i=interp2(x,y,z,xi,yi','cubic');
    subplot(1,2,1),surfc(xi,yi,z3i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('立方插值');
    subplot(1,2,2),contour(xi,yi,z3i,10,'r'),title('立方插值等高线图');
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述
    三次样条插值法及等高线图:

    figure(5)
    z4i=interp2(x,y,z,xi,yi','spline');
    subplot(1,2,1),surfc(xi,yi,z4i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('三次样条插值');
    subplot(1,2,2),contour(xi,yi,z4i,10,'r'),title('三次样条插值等高线图');
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述
    分段线性插值法及其等高线图:

    figure(6)
    z5i=interp2(x,y,z,xi,yi');
    subplot(1,2,1),surfc(xi,yi,z5i),xlabel('X'),ylabel('Y'),zlabel('Z'),title('分段线性插值');
    subplot(1,2,2),contour(xi,yi,z5i,10,'r'),title('分段线性插值等高线图');
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    比较由以上五种插值方法得到的地貌图和等高线图,可以看出:

    • 由于两个高度之间直线为最短距离,因此利用最邻近插值得到的地貌图和等高线为直线,描述的山地地貌皆为陡崖,对于一般山区的地貌是不符合的;
    • 分段线性插值得到的图像随着分段数目的增多,而更加平缓,棱角更加不明显。
    • 利用线性插值、三次样条插值和立方插值所得到的图像较为平滑,更加适合描述该山地的地貌。

    二、拟合

    2.1 曲线拟合的线性最小二乘法

    在这里插入图片描述
    原则上不需要经过图像中的任何一个点,只要保证与各点的距离总体足够小即可。

    线性最小二乘法是解决曲线拟合最常用的方法,其基本思路是,令
    在这里插入图片描述
    拟合的准则是使 y i y_i yi f ( x i ) f(x_i) f(xi)距离的平方和最小,称为最小二乘法。

    那么,系数 a k a_k ak该怎么确定呢?这里参考了《数学建模算法与应用》的证明过程。
    1)系数 a k a_k ak的确定
    在这里插入图片描述
    在这里插入图片描述
    2)函数 r k ( x ) r_k(x) rk(x)的选取
    面对一组数据 ( x i , y i ) (x_i,y_i) (xi,yi), i = 1 , 2 , . . . , n i=1 ,2,...,n i=1,2,...,n,用线性最小二乘法作曲线拟合时,首要的也是关键的一步是恰当地选取 r 1 ( x ) , . . , r m ( x ) r_1(x),..,r_m (x) r1(x),..,rm(x) 。如果通过机理分析,能够知道y与x之间的函数关系, 则 r 1 ( x ) , . . , r m ( x ) r_1(x),..,r_m (x) r1(x),..,rm(x) 容易确定。若无法知道 y y y x x x 之间的关系,通常可以将数据 ( x i , y i ) (x_i,y_i) (xi,yi), i = 1 , 2 , . . . , n i=1 ,2,...,n i=1,2,...,n 作图,直观地判断应该用什么样的曲线去作拟合。常用的曲线有如下:
    在这里插入图片描述
    已知一组数据,用什么样的曲线拟合最好,可以在直观判断的基础上,选几种曲线分
    别拟合,然后比较,看哪条曲线的最小二乘指标 J J J 最小。

    在Matlab中,线性最小二乘法的标准型为:
    在这里插入图片描述

    【例】 用最小二乘法求一个形如 y = a + b x 2 y=a+bx^2 y=a+bx2 的经验公式,拟合下表中的数据。
    在这里插入图片描述

    X=[19 25 31 38 44]';
    Y=[19.0 32.3 49.0 73.3 97.8]';
    R=[ones(5,1),x.^2]
    
    • 1
    • 2
    • 3

    我们看一下这里R的值,进一步理解上文推导过程中的含义:
    在这里插入图片描述
    用Matlab标准型的命令求系数:

    ab=R\Y
    
    • 1

    求得的结果如下:
    在这里插入图片描述
    意味着,求得的拟合公式为: y = 0.9726 + 0.05 x 2 y=0.9726 + 0.05x^2 y=0.9726+0.05x2

    我们来看一下该曲线的拟合效果如何?

    x0=19:0.1:44;
    y0=ab(1)+ab(2)*x0.^2;
    plot(X,Y,'o',x0,y0,'r')
    
    • 1
    • 2
    • 3

    在这里插入图片描述
    注:这里可以联想到GM(1,1)模型中用到了最小二乘法。
    在这里插入图片描述

    2.2 多项式拟合

    如果取
    在这里插入图片描述
    即用 m m m 次多项式拟合给定数据,MatLab中有现成的函数a=polyfit(x0,y0,m)
    其中,输入参数 x 0 、 y 0 x_0、y_0 x0y0 为要拟合的数据; m m m 为拟合多项式的次数。输出参数 a a a 为拟合多项式的系数向量。

    【例】 某乡镇企业1990年—1996年的生产利润如表所列。
    在这里插入图片描述
    试预测1997年和1998年的利润。

    思路如下:
    首先第一步我们可以作已知数据的散点图,直观判断其需要什么样的多项式拟合。

    x0=[1990  1991  1992  1993  1994  1995  1996];
    y0=[70   122   144   152   174   196   202];
    plot(x0,y0,'*')
    
    • 1
    • 2
    • 3

    在这里插入图片描述
    我们可以发现,该乡镇企业的年生产利润几乎直线上升。因此,可以用 y = a 1 x + a 0 y=a_1x+a_0 y=a1x+a0 作为拟合函数来预测该乡镇企业未来的年利润。代码如下:

    x0=[1990  1991  1992  1993  1994  1995  1996];
    y0=[70   122   144   152   174   196   202];
    a=polyfit(x0,y0,1)
    y97=polyval(a,1997)
    y98=polyval(a,1998)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    最终求得的结果为:(注意,次数高的项在前面)
    在这里插入图片描述

    在这里插入图片描述

    2.3 指定函数拟合

    fittype是自定义拟合函数,cfun=fit(x,y,f)。拟合数据 x 、 y x、y xy 必须为列向量。

    假设原始数据散点图如下所示:
    在这里插入图片描述
    我们可以编写一个m文件来实现自定义拟合函数。

     syms t
     x = [0;0.4;1.2;2;2.8;3.6;4.4;5.2;6;7.2;8;9.2;10.4;11.6;12.4;13.6;14.4;15];
     y = [1;0.85;0.29;-0.27;-0.53;-0.4;-0.12;0.17;0.28;0.15;-0.03;-0.15;-0.071;0.059;0.08;0.032;-0.015;-0.02];
     f = fittype('a*cos(k*t)*exp(w*t)','independent','t','coefficients',{'a','k','w'});
     cfun = fit(x,y,f)    %显示拟合函数
     xi = 0:.1:20;
     yi = cfun(xi);
     plot(x,y,'r*',xi,yi,'b-');
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述
    求出来系数 a 、 k 、 w a、k、w akw 的值分别为:
    在这里插入图片描述

    三、综合案例

    在这里插入图片描述
    先挖一个坑在这,有空再来写。

    参考文章

    [1] 插值算法——分段线性插值(1)
    [2] 如何直观地理解拉格朗日插值法?(知乎)
    [3] 数值分析(一) 牛顿插值法及matlab代码
    [4] 数值分析(二) 三次样条插值法matlab程序
    [5] 数学建模学习-插值法
    [6] 数学建模——拟合

  • 相关阅读:
    JVM相关知识点
    TikTok生态圈【6.27跨境日报】TikTok夏季大甩卖利用现场活动中的游戏化
    一个示例学习C语言到汇编层面
    Spring boot多数据源实现动态切换
    深度系统(Deepin)开机无法登录,提示等待一千五百分钟
    vue项目如何防范XSS攻击?
    最受欢迎的国际棒球锦标赛·棒球7号位
    PHP 数组在底层的实现原理
    only id(String) method calls allowed in plugins {} script block
    Oracle-Autoupgrade方式升级19c
  • 原文地址:https://blog.csdn.net/Serendipity_zyx/article/details/126632129