请选择 进入手机版 | 继续访问电脑版
楼主: handsome8848
6829 43

[教与学] 每周一题2: 讨论贴 [推广有奖]

  • 0关注
  • 17粉丝

副教授

35%

还不是VIP/贵宾

-

TA的文库  其他...

博弈论官方文库

威望
1
论坛币
56555 个
通用积分
10.5346
学术水平
72 点
热心指数
108 点
信用等级
83 点
经验
25634 点
帖子
417
精华
2
在线时间
433 小时
注册时间
2009-5-10
最后登录
2023-2-9

handsome8848 在职认证  发表于 2013-7-28 11:49:20 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
每周一题2: 请问你选A还是选B?已经顺利结束,首先感谢各位版友的热心参与,希望这个活动能越办越好!


回顾一下问题:
单项选择题

请在下面2个选项中做出选择:
A. 如果选A的人数大于等于总答题(参与)人数的一半,您将获得2论坛币;否则为0。

B. 如果选A的人数大于等于总答题(参与)人数的一半,您将获得10论坛币;否则为0。

1. 请做出选择(A或者B),并且给出您选择的理由。
2. 尽可能地详细的探索 a) 是否存在Nash均衡 b) 如果存在,请给出;如果不存在,请证明。
首先,公布实验结果:86位给出明确选择的版友里,35位选择A,51位选择B,因此此次实验收入为0!

——————————————————————————
下面就这次的题目发表一些我的见解:


1. 有几位朋友反应题目不够贴近“现实”,或说题目没有“价值”:
首先感谢提出建议,但是目前题目的来源主要是根据我个人对博弈论的一些了解以及看到的一些相关的趣题而来,个人力量终究有限,所以期待更多有想法、有资源的版友不吝分享。
再者,纯粹“现实”中的问题,很难抽象出博弈论的模型,如果抽象模型、联系实际问题并非难事,那么发paper也轻而易举了,所以我能做到的也只是尽量贴近生活,让大家面对的不只是枯燥的payoff matrix,鼓励大家思考。
最后,个人感觉这次虽然“题目”部分有些难度,但是这次的主要目的是鼓励大家参与到现实中的“博弈”,体会到一些博弈论中的概念(什么是strategy,什么是payoff,什么是equilibrium),今后也会举行类似的“实战”,所以个人感觉这次的题目还是挺贴近现实的。


2. 非常抱歉这次的题目有些难懂,有几位版友反应题目出错了(which is not): 他们纠结的是,A、B选项的前半部分一样,那么就没有“说选B的后果"。其实大家可以多想一步,如果大家都选B了,那么A,B的条件(如果选A的人数大于等于一半)无法成立,那么无论选A、B的payoff都是0了。


而这个题目的intuition也正在此:选A的话比较保险,如果大家都选A,那么就能够得到2论坛币了。但是大家又不甘心选A,因为A、B的前提条件一样,选A拿2论坛币的时候选B可以拿10论坛币,所以大家又有选B的动机。一旦大家都指望着别人选A,而自己选B,那么结果将是这次实验的结果 lol


今后遇到题目有疑问,首先还请仔细读题+思考,如果仍然觉得有疑问欢迎私信联系我,我将尽可能对题目做出一些解释。


3. 很多朋友或多或少提到了”囚徒困境“的概念,从上面的分析可以看出,这个问题确实类似囚徒困境。但是,这个问题并不(完全)是囚徒困境:
a. 囚徒困境中,选择坦白如果被占便宜的话,自己是有“正”损失的。而这里如果被占便宜,而这里并没有“正”损失。损失的只是一个可能的赢的机会。囚徒困境中,选择“欺骗”是在任何情况下都严格优于坦白的,而这里,当其他人都选择B的时候,你选择A或者选B其实payoff是一样的。换句话说,囚徒困境里选择欺骗是strictly dominant strategy,而这里选B充其量只算是weakly dominant strategy。
b. 那么选B究竟是不是weakly dominante strategy呢?其实不是的,或者说大多数情况下是,但是极少数情况下不是。假设一共有4个人,2个选A,2个选B。此时对于任何一个选A的人来说,选A的payoff将比选B要高。因此,B甚至没有weakly dominate A。
c. 鉴于a,b两点原因,这题的均衡会和囚徒困境稍有不同。首先澄清一下均衡的概念,均衡是所有人strategy (s_i)的集合,在这个问题里可以认为是所有人的选择的集合。Nash均衡的定义是说,所有人在给定其他人策略不变的情况下,自己选择的策略(s_i)是“最优”的,换句话说,没有unilateral profitable deviation。
因此这题的均衡将有两种形态...(还是留待最后揭晓吧 :D)


4. 还有很多朋友提到了“期望收益”。说到“期望”收益,就不得不提到“概率”,我选择A的“期望”收益是多少,是依赖于其他人选A,B的概率的,我们没有理由假设这是一个均匀分布(虽然这是最简单的)。而Nash均衡下的混合策略,计算期望收益的时候,其他人选A,B的概率将是他们的策略(需要保持consistent)。


这次的例子比较复杂,我们不妨换一个更简单的matching pennies
         H          T
H    (1,-1)   (-1,1)
T     (-1,1)   (1,-1)
这里我们知道唯一的均衡是,两个人都以1/2的概率选择H/T。那么我(假设为row player)选择H的期望收益将是:
1/2(column选择H的概率)*1(H,H)+1/2*(-1)(H,T)=0。
这里计算概率用的1/2正好是column player的strategy,这个概率并不是随意取的,而是均衡下对方选择的概率。


回到我们的问题,很多版友算“期望”概率的时候,都没有考虑到概率与其他人strategy的consistency的问题,所以得出了“A的期望收益不如B高”的结论。


4. 说到这里,该公布这次的参考答案了:

本帖隐藏的内容

这个Game既有纯策略Nash均衡也有混合策略Nash均衡。
纯策略Nash均衡有以下两种(以人数N为奇数为例,偶数类推):
1. 选择B的人数大于(N+1)/2,此时选A的人没有动力改成(deviate)选B,因为两者都是0收入。选B的人也没有动力改成选A,因为即使自己改成选A,选A的人数还是不足一半,所得收入还是0。所以这是一种Nash均衡,也是我们这次实验所落入的Nash均衡。


2. 选A的人数为(N+1)/2,选B的人数为(N-1)/2。此时,选A的人数“刚好”超过总人数的一半:若选A的人想获得更高的收入从而改选B,那么选A的人数将会不足一半,从而自己的收入将会从2(选A)变到0(选B);本来就选B的人当然也没有动力改成选A了。

这里我们看到,纯策略Nash均衡(type 2)达到的条件十分苛刻,而且并没有给定如何达到(哪些人选A,哪些人选B并没有规定)。所以Nash均衡只是一个“神奇”的鞍点,到了这个点,所有人都不会“想出去”(指的是单方面移动),但是如何“到”这个点,却不是Nash均衡告诉我们的。


因此,Nash均衡其实对结果的predictability其实并不高!(但是,严格占优策略得到的均衡(如囚徒困境)确是较为容易发生的)


至于混合策略,留给聪明的小伙伴们自己开动脑筋想想吧,或许就是下一次的每周一题噢!


Hint:回忆一下,上面提到的matching pennies的1/2 1/2是如何算出来的?




欢迎跟贴讨论!
由于时间匆忙,原帖中网友的精彩回复未来得及消化整理,将在楼下选择性分享~
________________________________________________________
广告时间:每周一题3正在火热举行,期待您的参与!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:每周一题 Consistency equilibrium consistent profitable 选择题 答题

回帖推荐

handsome8848 发表于9楼  查看完整内容

Nash均衡强调的是单方面移动。 这其实是多个均衡的选择问题,一个game可能有多个均衡的,虽然大家都得0是一个低水平的均衡,但是此时,任何人改动自己的策略是不能使自己变得更好的,换言之没有人将会改变自己的选择。 而且,一半人选A、一半人选B也不意味着1/2的概率选A,1/2的概率选B,这两者使没有对应关系的哈~

whe58 发表于8楼  查看完整内容

此题的纳什均衡为: 当局中人个数N为奇数时,选A的人数为(N+1)/2,选B的人数为(N-1)/2; 当局中人个数N为偶数时,选A的人数为N/2,选B的人数为N/2。 所以此题的混合策略为: 当局中人个数N为偶数时,应该以50%的概率选择A,50%的概率选择B,即通过抛硬币选择混合策略; 当局中人个数N为奇数时,应该以(N+1)/2N的概率选择A,(N-1)/2N的概率选择B。

whe58 发表于6楼  查看完整内容

此题纯策略Nash均衡是不存在的。因为没有上策,而大家都必须同时选择,究竟多少人选择A,多少人选择B,无人知晓。 楼主说:“1. 选择B的人数大于(N+1)/2,此时选A的人没有动力改成(deviate)选B,因为两者都是0收入。选B的人也没有动力改成选A,因为即使自己改成选A,选A的人数还是不足一半,所得收入还是0。所以这是一种Nash均衡,也是我们这次实验所落入的Nash均衡。”——其实这不是纳什均衡,这只是某种客观的结果而已。不能 ...

本帖被以下文库推荐

luling2010 发表于 2013-7-29 08:32:09 |显示全部楼层 |坛友微信交流群
看下参考答案

使用道具

文金惠 发表于 2013-7-29 08:51:57 |显示全部楼层 |坛友微信交流群
求正解

使用道具

jellygrape 发表于 2013-7-29 14:37:40 |显示全部楼层 |坛友微信交流群
看看

使用道具

whe58 在职认证  发表于 2013-7-29 16:46:03 |显示全部楼层 |坛友微信交流群
看看
教书匠

使用道具

whe58 在职认证  发表于 2013-7-29 17:04:28 |显示全部楼层 |坛友微信交流群
此题纯策略Nash均衡是不存在的。因为没有上策,而大家都必须同时选择,究竟多少人选择A,多少人选择B,无人知晓。
楼主说:“1. 选择B的人数大于(N+1)/2,此时选A的人没有动力改成(deviate)选B,因为两者都是0收入。选B的人也没有动力改成选A,因为即使自己改成选A,选A的人数还是不足一半,所得收入还是0。所以这是一种Nash均衡,也是我们这次实验所落入的Nash均衡。”——其实这不是纳什均衡,这只是某种客观的结果而已。不能说存在的就是合理的。按楼主的逻辑,只要A<B,就都是纳什均衡了。错!如果人们知道A<B,相信所有选择B的人都有动机改选A。因为坚持选择B,就是0,而改选A有可能得2。
教书匠

使用道具

whe58 在职认证  发表于 2013-7-29 17:15:37 |显示全部楼层 |坛友微信交流群
此题的纳什均衡为:99个局中人——A=50,B=49;100个局中人——A=50,B=50;101个局中人——A=51,B=50。总之A>=B。即楼主所说,当N为奇数时,选A的人数为(N+1)/2,选B的人数为(N-1)/2。N为偶数时选A的人数为N/2,选B的人数为N/2——纳什均衡。
教书匠

使用道具

whe58 在职认证  发表于 2013-7-29 17:37:32 |显示全部楼层 |坛友微信交流群
此题的纳什均衡为: 当局中人个数N为奇数时,选A的人数为(N+1)/2,选B的人数为(N-1)/2; 当局中人个数N为偶数时,选A的人数为N/2,选B的人数为N/2。 所以此题的混合策略为: 当局中人个数N为偶数时,应该以50%的概率选择A,50%的概率选择B,即通过抛硬币选择混合策略; 当局中人个数N为奇数时,应该以(N+1)/2N的概率选择A,(N-1)/2N的概率选择B。
教书匠

使用道具

handsome8848 在职认证  发表于 2013-7-29 18:13:31 |显示全部楼层 |坛友微信交流群
whe58 发表于 2013-7-29 17:04
此题纯策略Nash均衡是不存在的。因为没有上策,而大家都必须同时选择,究竟多少人选择A,多少人选择B,无人 ...
Nash均衡强调的是单方面移动。

这其实是多个均衡的选择问题,一个game可能有多个均衡的,虽然大家都得0是一个低水平的均衡,但是此时,任何人改动自己的策略是不能使自己变得更好的,换言之没有人将会改变自己的选择。

而且,一半人选A、一半人选B也不意味着1/2的概率选A,1/2的概率选B,这两者使没有对应关系的哈~

使用道具

Jeremiahc 发表于 2013-7-29 20:14:58 |显示全部楼层 |坛友微信交流群
哈哈哈哈哈

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 22:11