• 博弈论——斯塔克尔伯格模型(Stackelberg model)


    斯塔克尔伯格模型(Stackelberg model)

    0 前言

    前两篇文章中我们提到了连续产量的古诺模型以及可以应用于古诺模型的反应函数。
    博弈论——连续产量古诺模型
    博弈论——反应函数
    古诺模型中,我们强调了:
    (1)两个厂商是同时决策的,即博弈只有一个阶段;
    (2)决策之前都不知道另一方产量;
    (3)两个厂商之间没有主从关系,在市场上的地位是平等的,
    古诺模型为完全信息静态博弈
    当上述3个条件改变时:
    (1)两个厂商并不是同时决策,而是一方先决策,另一方根据对方的决策,再作出决策,即博弈有两个阶段(动态博弈);
    (2)后做决策的博弈方,知道先做决策的博弈方的决策;
    (3)两个厂商中,一个寡头厂商是处于支配地位的领导者,另一个是寡头厂商的追随者,即两个厂商在市场上是不对称的竞争。
    此时,博弈便从古诺模型转为了斯塔克尔伯格模型(Stackelberg)

    1 介绍

        斯塔克尔伯格模型(Stackelberg model)由德国经济学家斯塔克尔伯格提出的一种产量领导模型,该模型反映了企业间不对称的竞争。
        在古诺模型里,竞争厂商在市场上的地位是平等的,因而它们的行为是相似的,而且,它们的决策是同时的。当企业甲在作决策时,它并不知道企业乙的决策。但事实上,在有些市场,竞争厂商之间的地位并不是对称的,市场地位的不对称引起了决策次序的不对称,通常,小企业先观察到大企业的行为,再决定自己的对策。斯塔克尔伯格建立的模型就反映了这种不对称的竞争。
        在斯塔克尔伯格的寡头理论中,提出了将寡头厂商的角色定位为“领导者”与“追随者”的分析范式。一般来说,古诺模型中的两个厂商势均力敌,而斯塔克尔伯格的寡头厂商模型中,一个是实力雄厚的领导者,一个是实力相对较弱的追随者。
        该模型的基本假定条件是:在一个寡头行业中有两个厂商,他们生产相同的产品,其中,一个寡头厂商是处于支配地位的领导者,另一个是寡头厂商的追随者
        另外,与古诺模型一样,每个厂商的决策变量都是产量,即每个厂商都会选择自己的最优产量来实现利润最大化;并且,古诺模型为静态博弈,双方同时作出决定,但是斯塔克尔伯格模型为动态博弈,领导者先做决策,追随者后做决策。

    2 斯塔克尔伯格模型及求解

    斯塔克尔伯格模型的博弈结构、参数与古诺模型类似:
    Player:两个供应相同产品的厂商
    产量:厂商1的产量为q1,厂商2的产量为q2,市场总供给为Q=q1+q2。
    市场出清价格P:市场总供给的函数P(Q)=8-Q (市场出清价格是可以将产品全部卖出的价格)
    成本:设两个厂商都无固定成本,每增加一单位产量的边际成本c1=c2=c。

        和古诺模型一样,该博弈两博弈方的策略空间是他们可以选择的产量。假设产量是连续变量,也就是说两厂商有无限多种可选策略。两博弈方的得益是两个厂商各自的利润,即各自的销售收益减去各自的成本:
    π 1 = q 1 P ( Q ) − q 1 c = q 1 ( 8 − ( q 1 + q 2 ) ) − c q 1 = − q 1 2 − c q 1 − q 1 q 2 + 8 q 1 π_1=q_1 P(Q)-q_1 c=q_1 (8-(q_1+q_2 ))-cq_1=-q_1^2-cq_1-q_1 q_2+8q_1 π1=q1P(Q)q1c=q1(8(q1+q2))cq1=q12cq1q1q2+8q1

    π 2 = q 2 P ( Q ) − q 2 c = q 2 ( 8 − ( q 1 + q 2 ) ) − c q 2 = − q 2 2 − c q 2 − q 1 q 2 + 8 q 2 π_2=q_2 P(Q)-q_2 c=q_2 (8-(q_1+q_2 ))-cq_2=-q_2^2-cq_2-q_1 q_2+8q_2 π2=q2P(Q)q2c=q2(8(q1+q2))cq2=q22cq2q1q2+8q2
    其中, π 1 π_1 π1 π 2 π_2 π2分别是厂商1、厂商2的利润。

        用逆推归纳法求子博弈完美纳什均衡。先分析第二阶段厂商2的决策,此时厂商1(领导者)的 q 1 q_1 q1已经决定且厂商2(追随者)知道,因此对厂商2来说是在给定 q 1 q_1 q1的情况下求使 π 2 π_2 π2最大的 q 2 q_2 q2 q 2 q_2 q2必须满足一阶条件,即
    − 2 q 2 − c − q 1 + 8 = 0 -2q_2-c-q_1+8=0 2q2cq1+8=0

    求得:
    q 2 = 8 − c − q 1 2 ( 1 ) q_2=\frac{8-c-q_1}{2} \quad\quad (1) q2=28cq1(1)
    这是厂商2(追随者)对厂商1(领导者)的反应函数。

        厂商1知道厂商2的决策思路,在选择 q 1 q_1 q1时就知道厂商2的产量 q 2 ∗ q_2^* q2会根据(1)式确定,所以可以直接将(1)式代入自己的得益函数,这样厂商1的得益函数转化成自己产量的一元函数,即
    π 1 = − q 1 2 − c q 1 − q 1 q 2 ∗ + 8 q 1 = − q 1 2 2 + ( 4 − c 2 ) q 1 ( 2 ) π_1=-q_1^2-cq_1-q_1 q_2^*+8q_1=-\frac{q_1^2}{2}+(4-\frac{c}{2}) q_1 \quad\quad(2) π1=q12cq1q1q2+8q1=2q12+(42c)q1(2)
    式(2)表明,当厂商1把厂商2的反应考虑进来后,厂商1的得益就完全由自己控制了,所以领导者一方可以控制自己的得益,而追随者需要根据领导者的决策进而决定自己的决策。这也说明了斯塔克尔伯格模型中,领导性厂商的决策不再需要自己的反应函数。

    将式(2)对 q 1 q_1 q1求导:
    d π 1 d q 1 = − q 1 + 4 − c 2 \frac{dπ_1}{dq_1} =-q_1+4-\frac{c}{2} dq1dπ1=q1+42c
    d π 1 d q 1 = 0 \frac{dπ_1}{dq_1} =0 dq1dπ1=0得到:
    q 1 ∗ = 4 − c 2 q_1^*=4-\frac{c}{2} q1=42c

    即厂商1的最佳产量为 4 − c 2 4-\frac{c}{2} 42c,代入到(1)式中得到厂商2的最佳产量为
    q 2 ∗ = 8 − c − q 1 ∗ 2 = 2 − c 4 q_2^*=\frac{8-c-q_1^*}{2}=2-\frac{c}{4} q2=28cq1=24c
    此时,市场总供给量为:
    Q = q 1 ∗ + q 2 ∗ = 4 − c 2 + 2 − c 4 = 6 − 3 c 4 Q=q_1^*+q_2^*=4-\frac{c}{2}+2-\frac{c}{4}=6-\frac{3c}{4} Q=q1+q2=42c+24c=643c
    市场价格为:
    P = 8 − Q = 8 − ( 6 − 3 c 4 ) = 2 + 3 c 4 P=8-Q=8-(6-\frac{3c}{4})=2+\frac{3c}{4} P=8Q=8(643c)=2+43c

    厂商1的得益为:
    π 1 = q 1 P ( Q ) − q 1 c = ( 4 − c 2 ) ( 2 + 3 c 4 − c ) = ( 4 − c 2 ) ( 2 − c 4 ) = ( 8 − c ) 2 8 π_1=q_1 P(Q)-q_1 c=(4-\frac{c}{2})(2+\frac{3c}{4}-c)=(4-\frac{c}{2})(2-\frac{c}{4})=\frac{(8-c)^2}{8} π1=q1P(Q)q1c=(42c)(2+43cc)=(42c)(24c)=8(8c)2
    厂商2的得益为
    π 2 = q 2 P ( Q ) − q 2 c = ( 2 − c 4 ) ( 2 + 3 c 4 − c ) = ( 8 − c ) 2 16 π_2=q_2 P(Q)-q_2 c=(2-\frac{c}{4})(2+\frac{3c}{4}-c)=\frac{(8-c)^2}{16} π2=q2P(Q)q2c=(24c)(2+43cc)=16(8c)2
    总得益为:
    π ∗ = π 1 + π 2 = 3 ( 8 − c ) 2 16 π^*=π_1+π_2=\frac{3(8-c)^2}{16} π=π1+π2=163(8c)2

    3 模型比较:

    将上述结果与两寡头同时选择产量的古诺模型进行比较:

    (1)古诺模型
    厂商1和厂商2的最佳决策为
    { q 1 ∗ = 8 − c 3 q 2 ∗ = 8 − c 3 {q1=8c3q2=8c3

    {q1=38cq2=38c
    市场总供给
    Q = q 1 ∗ + q 2 ∗ = 16 − 2 c 3 Q=q_1^*+q_2^*=\frac {16-2c}{3} Q=q1+q2=3162c
    故双方的得益分别为:
    π 1 = ( 8 − c ) 2 9 π_1=\frac{(8-c)^2}{9} π1=9(8c)2
    π 2 = ( 8 − c ) 2 9 π_2=\frac{(8-c)^2}{9} π2=9(8c)2
    总收益为
    π s ∗ = π 1 + π 2 = 2 ( 8 − c ) 2 9 π_s^*=π_1+π_2=\frac{2(8-c)^2}{9} πs=π1+π2=92(8c)2

    (2)斯塔克尔伯格模型
    厂商1和厂商2的最佳决策为
    { q 1 ∗ = 4 − c 2 q 2 ∗ = 2 − c 4 {q1=4c2q2=2c4

    {q1=42cq2=24c
    市场总供给为
    Q = 6 − 3 c 4 Q=6-\frac{3c}{4} Q=643c
    双方的得益为:
    π 1 = ( 8 − c ) 2 8 π_1=\frac{(8-c)^2}{8} π1=8(8c)2
    π 2 = ( 8 − c ) 2 16 π_2=\frac{(8-c)^2}{16} π2=16(8c)2
    总得益为:
    π ∗ = π 1 + π 2 = 3 ( 8 − c ) 2 16 π^*=π_1+π_2=\frac{3(8-c)^2}{16} π=π1+π2=163(8c)2

    通过比较,不难发现斯斯塔克尔伯格模型的产量大于古诺模型,价格低于古诺模型,总得益(两厂商得益之和)小于古诺模型,但厂商1的得益大于古诺模型两个厂商的得益,这反映了两个厂商之间地位不对称性的影响

  • 相关阅读:
    [计算机入门] 应用软件介绍(娱乐类)
    python使用opencv库对比两张图片并用红框标记出不同点
    2022下半年教资已经开始注册,1分钟看懂证件照审核要求
    常见数字 | 资料分析
    Mybatis 动态SQL – 使用choose标签动态生成条件语句
    用人工智能预测彩票,利用大数据预测彩票
    【0118】PostgreSQL 14.4修复了索引损坏
    Java线程安全问题
    完整的loader引导代码详解
    RTOS 中 Task 之间资源共享示例
  • 原文地址:https://blog.csdn.net/qq_43403025/article/details/133321576