我来说一下吧。首先,需要区分一下两个概念,一个是多次重复博弈NE,另一个是单次博弈NE。
题主说的 (T,L) (M,C) 这两个状态均是单次博弈下的NE,换句话说,如果只进行一次博弈,如果双方知道会处在这样的两个状态下,任何一方都没有意愿做出改变。
而多次博弈的NE则是在一个已知策略的情况下,就像题主描述的两人的策略。或者可以这么说,给出双方的策略,我们可以去验证这个策略是否是一个NE。验证的原则很简单,就是看是否有任何一方有偏移意愿,及偏移之后可以使自己的效用变大(至少不减少)。那么在题主给出的策略就应该作为已知条件(在博弈论中,策略对任何一方都是公开的),因此Player 1会按照他的策略来玩并且知道Player 2会怎么反应,反之亦然。
好的,根据题主的问题我们在假设第一阶段已经是(B,R)的情况下来看第二阶段的情况。这个时候,Player 1根据自己的策略选T,Player 2原策略是L。Player 2会选择偏移原定策略么?显然不会,因为Player 2选择C或者R只会得到比(T, L)小的效用,3>2, 3>1。因为Player 1会按照策略来玩,不会和Player 2同时做出改变。
同样可以验证,在该策略下,任何一个玩家在任何一个阶段都是没有偏移意愿的。
再进一步说,如果我们把策略调整一下,既然有两个单次博弈NE,那么如果策略改成
Player 1,第一轮选B,如果第一轮是(B,R)第二轮选M,否则选T
Player 2,第一轮选R,如果第一轮是(B,R)第二轮选C,否则选L
(不知道题主是不是想说这个)
那这样的策略可不可以呢? 答案是:不行。
大家可以自己验证一下,如果是这样的策略,那么Player 2在第一轮有动力进行策略偏移,即在第一轮选L,取得(0,5)。按照双方的策略,第二轮会得到(T,L)=(1,3)。那么Player 2得到的效用将大于原策略的效用:5+3>4+1。所以说这个新策略不是一个NE的策略。
不知道是否把题主的问题解答清楚了。