• 一个信号博弈模型的解法


    题目在这里:【北大光华金融硕士考研·微观】不完全信息动态博弈及其代表性经典真题(上)

    因为研究中要用到不完全信息动态博弈,所以研究了一下它,在B站上面找到了一个考研题针对不完全信息动态博弈的信号博弈模型进行求解,看完之后我记录下了自己的解题思考,防止自己忘记。

    【例】(厂商进入的信号博弈)现市场上有一新厂商打算进入市场,而自然决定这个进入者(后称 p 1 p_1 p1)强弱( θ s \theta_s θs, θ w \theta_w θw),同时在位厂商(后称 p 2 p_2 p2)不知进入厂商的类型是强( θ s \theta_s θs)还是弱( θ w \theta_w θw),但是可以观察到进入厂商释放的信号是强(S)还是弱(W)。在位厂商可以根据信号决定打(F,fight),还是适应(A,accommodate)

    【解】

    把收益图画出来。
    在这里插入图片描述

    思考:进入厂商 p 1 p_1 p1 有哪些策略: S S SS SS W W WW WW S W SW SW W S WS WS

    说明:以 S S SS SS 为例,第一个 S S S 的意思是,当 p 1 p_1 p1 θ s \theta_s θs 时,发出 S S S 信号;第二个 S S S 的意思是,当 p 1 p_1 p1 θ w \theta_w θw 时,发出 S S S 信号。

    在位厂商 p 2 p_2 p2 有哪些策略: F F FF FF A A AA AA F A FA FA A F AF AF

    说明:以 F F FF FF 为例,第一个 F F F 的意思是,当 p 2 p_2 p2 接受到 S S S 信号时,作出 F F F 动作;第二个 F F F 的意思是,当 p 2 p_2 p2 接受到 W W W 信号时,作出 F F F 动作。

    求解

    (1)考虑 S 1 = S W S_1=SW S1=SW

    解释: p 1 p_1 p1 θ s \theta_s θs 时释放 S S S 信号, p 1 p_1 p1 θ w \theta_w θw 时释放 W W W 信号。

    这是“说实话”的情况,那么在贝叶斯信念中,

    { μ ( θ s ∣ S ) = 1 , μ ( θ w ∣ W ) = 1. \left\{

    μ(θs|S)μ(θw|W)=1,=1.
    \right. {μ(θsS)μ(θwW)=1,=1.

    那么从博弈树可知, p 2 p_2 p2 的策略为: S 2 = A F S_2=AF S2=AF

    解释:

    1. p 1 p_1 p1 类型为 θ s \theta_s θs,释放 S S S 信号, p 2 p_2 p2 选择 A A A 的收益高;
    2. p 1 p_1 p1 类型为 θ w \theta_w θw,释放 W W W 信号, p 2 p_2 p2 选择 F F F 的收益高。

    分析:由序贯理性可知,若 p 1 p_1 p1 知道 S 2 = A F S_2=AF S2=AF,则 p 1 p_1 p1 在自己类型为 θ w \theta_w θw 时,释放 S S S 信号。而 S 2 = A F S_2=AF S2=AF,则 p 2 p_2 p2 选择 A A A 策略,此时收益 B p 1 S = 2 B^S_{p_1}=2 Bp1S=2 反而高于 p 2 p_2 p2 F F F 的收益 B p 1 W = 1 B^W_{p_1}=1 Bp1W=1。 那么这样就不是一个精炼贝叶斯均衡(Perfect Bayesian Equilibrium, PBE)

    (2)考虑 S 1 = W S S_1=WS S1=WS

    解释: p 1 p_1 p1 θ s \theta_s θs 时释放 W W W 信号, p 1 p_1 p1 θ d \theta_d θd 时释放 S S S 信号。

    这是“说谎话”的情况,那么在贝叶斯信念中,

    { μ ( θ s ∣ S ) = 0 , μ ( θ s ∣ W ) = 1. \left\{

    μ(θs|S)μ(θs|W)=0,=1.
    \right. {μ(θsS)μ(θsW)=0,=1.

    那么从博弈树可知, p 2 p_2 p2 的策略为: S 2 = F A S_2=FA S2=FA

    解释:

    1. p 1 p_1 p1 类型为 θ s \theta_s θs,释放 W W W 信号, p 2 p_2 p2 选择 A A A 的收益高;
    2. p 1 p_1 p1 类型为 θ w \theta_w θw,释放 S S S 信号, p 2 p_2 p2 选择 F F F 的收益高。

    分析:由序贯理性可知,若 p 1 p_1 p1 知道 S 2 = F A S_2=FA S2=FA,则 p 1 p_1 p1 在自己类型为 θ w \theta_w θw 时,释放 W W W 信号。而 S 2 = F A S_2=FA S2=FA,则 p 2 p_2 p2 选择 A A A 策略,此时收益 B p 1 W = 3 B^W_{p_1}=3 Bp1W=3 反而高于 p 2 p_2 p2 F F F 的收益 B p 1 S = 0 B^S_{p_1}=0 Bp1S=0。 那么这样就不是 PBE。

    (3)考虑 S 1 = S S S_1=SS S1=SS

    解释: p 1 p_1 p1 θ s \theta_s θs 时释放 S S S 信号, p 1 p_1 p1 θ d \theta_d θd 时释放 S S S 信号。

    在贝叶斯信念中,

    { μ ( θ s ∣ S ) = P , μ ( θ s ∣ W ) = 任意值 . \left\{

    μ(θs|S)μ(θs|W)=P,=.
    \right. {μ(θsS)μ(θsW)=P,=任意值.

    只看左边的树。有: S 2 = A A S_2=AA S2=AA

    p 2 p_2 p2 中,选 A A A 的收益为 B p 2 A = 1 B^{A}_{p_2}=1 Bp2A=1,选 F F F 的收益为 B p 2 F = 0 × P + 2 × ( 1 − P ) = 2 ( 1 − P ) B^{F}_{p_2}=0\times P+2\times(1-P)=2(1-P) Bp2F=0×P+2×(1P)=2(1P)

    如果要让 B p 2 F < B p 2 A B^{F}_{p_2} < B^{A}_{p_2} Bp2F<Bp2A,则 2 ( 1 − P ) < 1 2(1-P)<1 2(1P)<1,得到

    P > 1 / 2. P > 1/2. P>1/2.

    那么结论是,若 P > 1 / 2 P > 1/2 P>1/2

    p 2 p_2 p2 的策略为 S 2 = A A S_2=AA S2=AA

    i)然而,也要考虑 p 1 p_1 p1 释放 W W W 的情况(虽然不会出现,也要讨论)

    可以发现, p 2 p_2 p2 A A A 的收益为 B p 2 A = 1 B^{A}_{p_2}=1 Bp2A=1,选 F F F 的收益为 B p 2 F = 0 × μ ( θ s ∣ w ) + 2 × ( 1 − μ ( θ s ∣ w ) ) = 2 ( 1 − μ ( θ s ∣ w ) ) B^{F}_{p_2}=0\times \mu(\theta_s|w)+2\times(1-\mu(\theta_s|w))=2(1-\mu(\theta_s|w)) Bp2F=0×μ(θsw)+2×(1μ(θsw))=2(1μ(θsw))

    因为 μ ( θ s ∣ w ) > 1 / 2 \mu(\theta_s|w) > 1/2 μ(θsw)>1/2,则 p 2 p_2 p2 选择 F F F 的收益为 B p 2 F = 2 ( 1 − μ ( θ s ∣ w ) ) < 1 B^{F}_{p_2}=2(1-\mu(\theta_s|w))<1 Bp2F=2(1μ(θsw))<1

    综上, S 2 = A A S_2=AA S2=AA

    但是! p 1 p_1 p1 θ w \theta_w θw 时可以认为,反正 p 1 p_1 p1 出什么信号, p 2 p_2 p2 都会选择 A A A 行为。从博弈树上可以看到, p 1 p_1 p1 释放 W W W 时,收益为 B p 1 W = 3 B^W_{p_1}=3 Bp1W=3 p 1 p_1 p1 释放 S S S 时,收益为 B p 1 S = 2 B^S_{p_1}=2 Bp1S=2

    那么, S 1 S_1 S1 有可能偏离到 S 1 = S W S_1=SW S1=SW 去,所以 ( S S , A A , P ) (SS,AA,P) (SS,AA,P) 不是PBE。

    ii)同样考虑 p 1 p_1 p1 释放 W W W 的情况。有: S 2 = A F S_2=AF S2=AF

    此时,选 F F F 的收益为 B p 2 F = 0 × P + 2 × ( 1 − μ ( θ s ∣ w ) ) = 2 ( 1 − μ ( θ s ∣ w ) ) B^{F}_{p_2}=0\times P+2\times(1-\mu(\theta_s|w))=2(1-\mu(\theta_s|w)) Bp2F=0×P+2×(1μ(θsw))=2(1μ(θsw))

    根据 2 ( 1 − μ ( θ s ∣ w ) ) > 1 2(1-\mu(\theta_s|w))>1 2(1μ(θsw))>1,得到 μ ( θ s ∣ w ) < 1 / 2 \mu(\theta_s|w) < 1/2 μ(θsw)<1/2 时, B p 2 F > 1 B^{F}_{p_2}>1 Bp2F>1

    那么,如果 p 1 p_1 p1 θ s \theta_s θs 释放 W W W 信号,有 B p 1 S = 3 → B p 1 W = 0 B^{S}_{p_1}=3 \rightarrow B^{W}_{p_1}=0 Bp1S=3Bp1W=0,是一个下降趋势;

    如果 p 1 p_1 p1 θ w \theta_w θw 释放 W W W 信号,有 B p 1 S = 2 → B p 1 W = 1 B^{S}_{p_1}=2 \rightarrow B^{W}_{p_1}=1 Bp1S=2Bp1W=1,也是一个下降趋势。

    所以, p 1 p_1 p1 不能为 θ s \theta_s θs 时释放 W W W 信号,也不能为 θ w \theta_w θw 时释放 W W W 信号。

    综上, ( S S , A F , μ ) (SS,AF,\mu) (SS,AF,μ) 为 PBE,但需满足 μ ( θ s ∣ w ) ≤ 1 / 2 , μ ( θ s ∣ s ) = P \mu(\theta_s|w)\le 1/2,\mu(\theta_s|s)=P μ(θsw)1/2,μ(θss)=P

    (4)考虑 S 1 = W W S_1=WW S1=WW

    解释: p 1 p_1 p1 θ s \theta_s θs 时释放 W W W 信号, p 1 p_1 p1 θ d \theta_d θd 时释放 W W W 信号。

    在贝叶斯信念中,

    { μ ( θ s ∣ w ) = P , μ ( θ s ∣ s ) = 任意值 . \left\{

    μ(θs|w)μ(θs|s)=P,=.
    \right. {μ(θsw)μ(θss)=P,=任意值.

    只看右边的树。有: S 2 = A A S_2=AA S2=AA

    p 2 p_2 p2 中,选 A A A 的收益为 B p 2 A = 1 B^{A}_{p_2}=1 Bp2A=1,选 F F F 的收益为 B p 2 F = 0 × P + 2 × ( 1 − P ) = 2 ( 1 − P ) B^{F}_{p_2}=0\times P+2\times(1-P)=2(1-P) Bp2F=0×P+2×(1P)=2(1P)

    如果要让 B p 2 F < B p 2 F B^{F}_{p_2} < B^{F}_{p_2} Bp2F<Bp2F,则 2 ( 1 − P ) < 1 2(1-P)<1 2(1P)<1,得到

    P > 1 / 2. P > 1/2. P>1/2.

    那么结论是,若 P > 1 / 2 P > 1/2 P>1/2

    p 2 p_2 p2 的策略为 S 2 = A A S_2=AA S2=AA

    i)然而,也要考虑 p 1 p_1 p1 释放 S S S 的情况(虽然不会出现,也要讨论)

    可以发现, p 2 p_2 p2 A A A 的收益为 B p 2 A = 1 B^{A}_{p_2}=1 Bp2A=1,选 F F F 的收益为 B p 2 F = 0 × μ ( θ s ∣ s ) + 2 × ( 1 − μ ( θ s ∣ s ) ) = 2 ( 1 − μ ( θ s ∣ s ) ) B^{F}_{p_2}=0\times \mu(\theta_s|s)+2\times(1-\mu(\theta_s|s))=2(1-\mu(\theta_s|s)) Bp2F=0×μ(θss)+2×(1μ(θss))=2(1μ(θss))

    因为 μ ( θ s ∣ s ) > 1 / 2 \mu(\theta_s|s) > 1/2 μ(θss)>1/2,则 p 2 p_2 p2 选择 F F F 的收益为 B p 2 F = 2 ( 1 − μ ( θ s ∣ s ) ) < 1 B^{F}_{p_2}=2(1-\mu(\theta_s|s))<1 Bp2F=2(1μ(θss))<1

    综上, S 2 = A A S_2=AA S2=AA

    但是! p 1 p_1 p1 θ s \theta_s θs 时可以认为,反正 p 1 p_1 p1 出什么信号, p 2 p_2 p2 都会选择 A A A 行为。从博弈树上可以看到, p 1 p_1 p1 释放 W W W 时,收益为 B p 1 W = 2 B^W_{p_1}=2 Bp1W=2 p 1 p_1 p1 释放 S S S 时,收益为 B p 1 S = 3 B^S_{p_1}=3 Bp1S=3

    那么, S 1 S_1 S1 有可能偏离到 S 1 = S W S_1=SW S1=SW 去,所以 ( S S , A A , P ) (SS,AA,P) (SS,AA,P) 不是PBE。

    ii)同样考虑 p 1 p_1 p1 释放 S S S 的情况。有: S 2 = F A S_2=FA S2=FA

    此时,选 F F F 的收益为 B p 2 F = 0 × P + 2 × ( 1 − μ ( θ s ∣ w ) ) = 2 ( 1 − μ ( θ s ∣ w ) ) B^{F}_{p_2}=0\times P+2\times(1-\mu(\theta_s|w))=2(1-\mu(\theta_s|w)) Bp2F=0×P+2×(1μ(θsw))=2(1μ(θsw))

    根据 2 ( 1 − μ ( θ s ∣ w ) ) > 1 2(1-\mu(\theta_s|w))>1 2(1μ(θsw))>1,得到 μ ( θ s ∣ w ) < 1 / 2 \mu(\theta_s|w) < 1/2 μ(θsw)<1/2 时, B p 2 F > 1 B^{F}_{p_2}>1 Bp2F>1

    那么,如果 p 1 p_1 p1 θ s \theta_s θs 释放 S S S 信号,有 B p 1 W = 2 → B p 1 S = 1 B^{W}_{p_1}=2 \rightarrow B^{S}_{p_1}=1 Bp1W=2Bp1S=1,是一个下降趋势;

    如果 p 1 p_1 p1 θ w \theta_w θw 释放 S S S 信号,有 B p 1 W = 3 → B p 1 S = 0 B^{W}_{p_1}=3 \rightarrow B^{S}_{p_1}=0 Bp1W=3Bp1S=0,也是一个下降趋势。

    所以, p 1 p_1 p1 不能为 θ s \theta_s θs 时释放 S S S 信号,也不能为 θ w \theta_w θw 时释放 S S S 信号。

    综上, ( W W , F A , μ ) (WW,FA,\mu) (WW,FA,μ) 为 PBE,但需满足 μ ( θ s ∣ s ) ≤ 1 / 2 , μ ( θ s ∣ w ) = P \mu(\theta_s|s)\le 1/2,\mu(\theta_s|w)=P μ(θss)1/2,μ(θsw)=P

  • 相关阅读:
    基于STM32的步进电机驱动设计( 含源码 )
    UDS知识整理(四):ECU复位——0x11服务
    nodejs+vue快递管理服务系统elementui
    STM32存储左右互搏 SPI总线读写FLASH W25QXX
    程序员如何悄悄拔尖,然后惊艳四座?
    kettle从入门到精通 第七十课 ETL之kettle kettle数据校验,脏数据清洗轻松拿捏
    100家!第一批5G应用解决方案供应商推荐名录
    Linux Tcp 连接 状态 检测 处理
    ICMPv6与NDP
    yolox
  • 原文地址:https://blog.csdn.net/Ruins_LEE/article/details/127857765