回顾一下问题:
单项选择题
请在下面2个选项中做出选择:
A. 如果选A的人数大于等于总答题(参与)人数的一半,您将获得2论坛币;否则为0。
B. 如果选A的人数大于等于总答题(参与)人数的一半,您将获得10论坛币;否则为0。
1. 请做出选择(A或者B),并且给出您选择的理由。
2. 尽可能地详细的探索 a) 是否存在Nash均衡 b) 如果存在,请给出;如果不存在,请证明。
——————————————————————————
下面就这次的题目发表一些我的见解:
1. 有几位朋友反应题目不够贴近“现实”,或说题目没有“价值”:
首先感谢提出建议,但是目前题目的来源主要是根据我个人对博弈论的一些了解以及看到的一些相关的趣题而来,个人力量终究有限,所以期待更多有想法、有资源的版友不吝分享。
再者,纯粹“现实”中的问题,很难抽象出博弈论的模型,如果抽象模型、联系实际问题并非难事,那么发paper也轻而易举了,所以我能做到的也只是尽量贴近生活,让大家面对的不只是枯燥的payoff matrix,鼓励大家思考。
最后,个人感觉这次虽然“题目”部分有些难度,但是这次的主要目的是鼓励大家参与到现实中的“博弈”,体会到一些博弈论中的概念(什么是strategy,什么是payoff,什么是equilibrium),今后也会举行类似的“实战”,所以个人感觉这次的题目还是挺贴近现实的。
2. 非常抱歉这次的题目有些难懂,有几位版友反应题目出错了(which is not): 他们纠结的是,A、B选项的前半部分一样,那么就没有“说选B的后果"。其实大家可以多想一步,如果大家都选B了,那么A,B的条件(如果选A的人数大于等于一半)无法成立,那么无论选A、B的payoff都是0了。
而这个题目的intuition也正在此:选A的话比较保险,如果大家都选A,那么就能够得到2论坛币了。但是大家又不甘心选A,因为A、B的前提条件一样,选A拿2论坛币的时候选B可以拿10论坛币,所以大家又有选B的动机。一旦大家都指望着别人选A,而自己选B,那么结果将是这次实验的结果 lol
今后遇到题目有疑问,首先还请仔细读题+思考,如果仍然觉得有疑问欢迎私信联系我,我将尽可能对题目做出一些解释。
3. 很多朋友或多或少提到了”囚徒困境“的概念,从上面的分析可以看出,这个问题确实类似囚徒困境。但是,这个问题并不(完全)是囚徒困境:
a. 囚徒困境中,选择坦白如果被占便宜的话,自己是有“正”损失的。而这里如果被占便宜,而这里并没有“正”损失。损失的只是一个可能的赢的机会。囚徒困境中,选择“欺骗”是在任何情况下都严格优于坦白的,而这里,当其他人都选择B的时候,你选择A或者选B其实payoff是一样的。换句话说,囚徒困境里选择欺骗是strictly dominant strategy,而这里选B充其量只算是weakly dominant strategy。
b. 那么选B究竟是不是weakly dominante strategy呢?其实不是的,或者说大多数情况下是,但是极少数情况下不是。假设一共有4个人,2个选A,2个选B。此时对于任何一个选A的人来说,选A的payoff将比选B要高。因此,B甚至没有weakly dominate A。
c. 鉴于a,b两点原因,这题的均衡会和囚徒困境稍有不同。首先澄清一下均衡的概念,均衡是所有人strategy (s_i)的集合,在这个问题里可以认为是所有人的选择的集合。Nash均衡的定义是说,所有人在给定其他人策略不变的情况下,自己选择的策略(s_i)是“最优”的,换句话说,没有unilateral profitable deviation。
因此这题的均衡将有两种形态...(还是留待最后揭晓吧 :D)
4. 还有很多朋友提到了“期望收益”。说到“期望”收益,就不得不提到“概率”,我选择A的“期望”收益是多少,是依赖于其他人选A,B的概率的,我们没有理由假设这是一个均匀分布(虽然这是最简单的)。而Nash均衡下的混合策略,计算期望收益的时候,其他人选A,B的概率将是他们的策略(需要保持consistent)。
这次的例子比较复杂,我们不妨换一个更简单的matching pennies
H T
H (1,-1) (-1,1)
T (-1,1) (1,-1)
这里我们知道唯一的均衡是,两个人都以1/2的概率选择H/T。那么我(假设为row player)选择H的期望收益将是:
1/2(column选择H的概率)*1(H,H)+1/2*(-1)(H,T)=0。
这里计算概率用的1/2正好是column player的strategy,这个概率并不是随意取的,而是均衡下对方选择的概率。
回到我们的问题,很多版友算“期望”概率的时候,都没有考虑到概率与其他人strategy的consistency的问题,所以得出了“A的期望收益不如B高”的结论。
4. 说到这里,该公布这次的参考答案了:
本帖隐藏的内容
这个Game既有纯策略Nash均衡也有混合策略Nash均衡。纯策略Nash均衡有以下两种(以人数N为奇数为例,偶数类推):
1. 选择B的人数大于(N+1)/2,此时选A的人没有动力改成(deviate)选B,因为两者都是0收入。选B的人也没有动力改成选A,因为即使自己改成选A,选A的人数还是不足一半,所得收入还是0。所以这是一种Nash均衡,也是我们这次实验所落入的Nash均衡。
2. 选A的人数为(N+1)/2,选B的人数为(N-1)/2。此时,选A的人数“刚好”超过总人数的一半:若选A的人想获得更高的收入从而改选B,那么选A的人数将会不足一半,从而自己的收入将会从2(选A)变到0(选B);本来就选B的人当然也没有动力改成选A了。
这里我们看到,纯策略Nash均衡(type 2)达到的条件十分苛刻,而且并没有给定如何达到(哪些人选A,哪些人选B并没有规定)。所以Nash均衡只是一个“神奇”的鞍点,到了这个点,所有人都不会“想出去”(指的是单方面移动),但是如何“到”这个点,却不是Nash均衡告诉我们的。
因此,Nash均衡其实对结果的predictability其实并不高!(但是,严格占优策略得到的均衡(如囚徒困境)确是较为容易发生的)
至于混合策略,留给聪明的小伙伴们自己开动脑筋想想吧,或许就是下一次的每周一题噢!
Hint:回忆一下,上面提到的matching pennies的1/2 1/2是如何算出来的?
欢迎跟贴讨论!
由于时间匆忙,原帖中网友的精彩回复未来得及消化整理,将在楼下选择性分享~
________________________________________________________
广告时间:每周一题3正在火热举行,期待您的参与!