看的Rubinstein那本博弈论,看得头大......
有如下问题:考察无限期重复博弈G*(设其要素博弈G为有限策略式博弈),
则已知有以下结论(下面并非完全原文,是个人读后的理解,请也帮我看看表述是否正确):
1)对于要素博弈G中的任意strictly enforceable的可行收益w,必能通过
在“均值极限”(limits of mean)收益形式下的无限期重复博弈G*
的某个完美子博弈均衡策略实现;(比如有限期的报复策略)
2)(根据其他博弈论教材,如Gibbons,即“弗里德曼无名氏定理”)
对于要素博弈G中的任意严格优于某纳什均衡收益的可行收益w,必能通过
在“折现”收益形式下(贴现因子接近1)的无限期重复博弈G*
的某个完美子博弈均衡策略实现;(比如“触发策略”)
3)但是Rubinstein这本书里又指出,
若对于要素博弈G中的任意strictly enforceable的可行收益w,
在“折现”收益形式下的无限期重复博弈G*中,上述“有限期的报复策略”
或者“触发策略”未必是该重复博弈的子博弈完美均衡策略!因为有可能当
某方开始偏离该均衡结果的行动计划时,应该施行报复的一方并不会真正这样做。
4)进一步,他给出了一种“rewarding the punisher”的策略,并得结论:
若对于要素博弈G中的任意strictly enforceable的可行收益w,
在“折现”(贴现因子接近1)收益形式下的无限期重复博弈G*中,
上述“rewarding the punisher”策略为实现收益w的完美子博弈均衡策略。
我看不明白最后那个“rewarding the punisher”策略具体是怎么操作的,
请达人速速指点!希望能给个直观且具体些的描述。
[此贴子已经被作者于2007-12-2 13:30:03编辑过]