我的理解是,SPNE要求players的策略必须蕴含所有的子博弈上的策略,不能因为某个子博弈是counterfactual的,就将它忽略掉。而对于某个subgame,player将在之前其他players选择的行动看做是参数,而不是信号。
举个Harris, Reny, and Robinson(1995)(
The Existence of Subgame-Perfect Equilibrium in Continuous Games with Almost Perfect Information: A Case for Public Randomization on JSTOR)的例子:
四个players,分别是,Aragaki, Bob, Catherine,和David。Aragaki的行动空间是
![A_1 = [-1,1]](//zhihu.com/equation?tex=A_1+%3D+%5B-1%2C1%5D)
, 而Bob, Catherine,和David的行动空间均为

。
整个博弈分两个阶段,在第一个阶段,Aragaki和 Bob同时选择,分别记做

和

。在第二阶段,Catherine和David均观测到

和

,并同时做出选择,即

和

。注意,和Aragaki和 Bob的情况不同,Catherine和David的行动空间和策略空间并不相同:

他们的效用函数均记做:

这个博弈无穷多个子博弈,除了自身外,每个子博弈对应一个

。我们可以理解为,在这个子博弈上,只有两个players,即Catherine和David,他们不会问这样的问题,为什么观测到的Aragaki和 Bob的行动是

而不是

。在这个子博弈上,Catherine和David的策略空间是

和

, 效用函数:

-----------------------------------------------------------------------------
关于player将在之前其他players选择的行动看做是参数,而不是信号, 见
恋爱中有哪些博弈? - 长泽雅美的回答。 如果Bob将Aragaki的第一步行动看做signgal,则只有一个NE。但如果用backward induction,则对应四种结果(SPNE不止4种)。
-----------------------------------------------------------------------------
接着第一部分的四人博弈,只是为了说明SPNE的存在并不是显然的。

,即Catherine和David自身的行动决定他们的支付是正还是负,而支付的绝对值由Aragaki的行动

决定。

,即Bob的支付是正还是负由是否他的行动和Catherine是否相同来决定,而支付的绝对值由自己的行动决定。

,即Aragaki最希冀的是Catherine和David的行动相同。其次是Bob和Catherine的行动不同。
Claim:如果存在SPNE,那么Aragaki和Bob的均衡策略都不是纯策略。
首先,只要

, 必然

。但是这样对于Bob他的最优策略必然是

.然而Aragaki可以提高自己的效用水平,通过选择

。
另外只有当Catherine和David的策略

满足

时, Aragaki才会选择

。但这样一来上面的情况还是会出现。所以Aragaki的均衡策略不会是纯策略。
对于Bob,选择纯策略

,则Aragaki的最优策略是

。
但这么一来,对于Bob来说,

可以带来更高的效用。
另一方面,如果Bob选择混合策略,那么他应该让0和1的概率均为0.5,否则Aragaki的最优策略将是纯策略,

或者不存在。另一方面如果Bob不选择等可能的混合策略,则Aragaki会针对的选择纯策略。
所以这个博弈不存在SPNE,尽管效用函数连续,players有限,而且唯一的无穷行动空间也是紧致的。
来源:知乎 www.zhihu.com
作者:
长泽雅美
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有
3 个回答,查看全部。
延伸阅读:
期望效用和期望值的效用两者的具体概念和差别是什么?
微观经济学里的序数排列和基数排列都是什么?