楼主: handsome8848
1354 6

[学科前沿] 每周一题3&4: 讨论贴 [推广有奖]

  • 0关注
  • 17粉丝

副教授

47%

还不是VIP/贵宾

-

TA的文库  其他...

博弈论官方文库

威望
1
论坛币
56560 个
通用积分
10.8346
学术水平
72 点
热心指数
108 点
信用等级
83 点
经验
25958 点
帖子
525
精华
2
在线时间
433 小时
注册时间
2009-5-10
最后登录
2023-2-9

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
每周一题3和4已经落下帷幕,这两次的参与人数较少(分别为2人和4人),还是说说我给这两次题目的思考吧:

首先,第三期题目:
问题1: 给定4位单身男生a, b, c, d, 以及4位单身女生A, B, C, D。他们对对方都有一个偏好排序(1>2>3>4), 可用如下矩阵表示:
...
那么,聪明的你能找出一个“稳定”的匹配么?请给出你的思路/方法。

这个题目是一个经典的题目,若干年前我就看过一个关于这个问题的讨论,并且近期受这个贴子的启发,看了下那本书(真的不错)的相关章节,才给出了这个题目。这个题目的用意是,版内有很多不错的资源、讨论,如果大家能多看看贴子、参加讨论,相信能够收获不少。


鉴于两位参与者都给出了正确的答案,所以这里不给出具体细节,对这个问题感兴趣的同学推荐看看那本书


这期的问题我感兴趣的是第2个问题和第3个问题:
问题2: 下面考虑“换室友”问题,4个男生a b c d对其他男生都有一个偏好排序,如下面矩阵所示:
a,b,c,d 四人将分成两对、成为室友,那么是否存在稳定的室友匹配呢?

问题3: 上面两种问题有什么区别与联系?
上面提到的书中说到,对于室友问题不一定存在稳定配对,但是对于女友问题却一定存在稳定配对,并给出了相应的反例/证明。但是书中并没有提到,室友问题存在稳定配对的条件、以及室友问题和女友问题的深层区别。这才是我感兴趣的,希望探究的东西(抱歉,这个问题我也没有完善的思考,是一个Open question)


可惜的是,没有人就这两个问题(2和3)给出了回答。(欢迎有想法的同学跟贴交流、探讨)

——————————————————————————————————————————————————————————
下面,第四期题目:
一位熟读博弈论的同学小C邀请你参加下面的赌局:

你和小C各拿出一枚硬币,每人都可以独立选择正面或背面朝上,用手盖住;待双方都做完选择后同时揭示选择:
若两人选择都是正面(Head),则你(从小C处,下同)赢取20元;
若两人选择都是背面(Tail),则你赢取x元;
若两人选择为一正一背面(1H1T),则你将输掉(输给小C)40元。
(假定双方都是理性人,追求金钱最大化)
问题:试用博弈论方法分析,当x分别为50,60,70时,你是否愿意参加这个赌局?为什么?
这题的4位参与者中,有1位给出了正确答案,另外3位或多或少陷入了出题的陷阱:


这个题目就涉及到我想澄清的一个概念,计算期望收益的时候一定要找到对应的概率分布!

本帖隐藏的内容

硬币的例子有点迷惑人,因为首先想到的就是1/2的分布,并且在经典的matching pennies例子中算出的均衡确实是1/2,然后得到了matching pennies是零和博弈(zero sum game),并且(碰巧)每个人的期望收益都是0,所以game可以看做是fair的。


这个题目,虽然也是零和博弈,但是如果我们算出这个game中每个人的期望收益,发现并不是都是0的。


为了计算期望收益,我们需要首先找到NE,(得到概率分布),然后再计算每个人的期望收益,具体步骤如下:
1. 写出payoff matrix,由于是零和,省略另一个人的收益:
20  -40
-40  x
混合策略均衡会使得对方选H和T的收益相等,20*p+(-40)*(1-p)=-40*p+x*(1-p)。以x=70为例,可以算出p=11/17.
同理,我们可以算出q=11/17.


2. 给定了双方的策略p=q=11/17,我们就可以算出每个人的期望收益了。事实上,由于选H和T的收益相等,所以任何mix的收益(对手play Nash)的时候=选H的收益=选T的收益,所以期望收益为: 20*11/17+(-40)*6/17<0(对于“我”)。
对于对手(C),类似的,他的期望收益是-Y(假设我的期望收益为Y)


所以我们可以看到,这个game对于“我”来说,期望收益是小于0的,所以不应该参加(无论x=50,60,70)。


3. 那么x=?的时候才是真正的“临界点”呢,答案就是x=80. 其实临界的时候刚好应该是两人的期望收益都是0.所以就方程:
20*p+(-40)*(1-p)=-40*p+x*(1-p) 左边来看,可以得到p=2/3。右边也等于0,即可得到x=80。




总结:这个题目告诉我们,不要被表面上的熟知的1/4 1/2 1/4的“经验分布”所迷惑。考虑期望收益的时候,一定要想清楚“概率分布”到底是什么。


其实,只有当自己计算期望收益的分布(猜的分布)与其他人选择的概率一致的时候,自己的选择才能站得住脚(justified)。如果我假设你一定选T,那么我选T就是最好的,但是这并不是NE,因为假设(你一定选T)是不“一致大”(consistent),你的最优选择并不是“一定选T”。


欢迎跟贴交流讨论~希望每周1题活动能有更多人参与~第五期活动传送门...


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:每周一题 matching question matrix payoff 落下帷幕 经典的 单身 资源

本帖被以下文库推荐

沙发
whe58 在职认证  发表于 2013-8-12 00:45:20 |只看作者 |坛友微信交流群
看看
教书匠

使用道具

藤椅
datou291 发表于 2013-8-19 11:35:33 |只看作者 |坛友微信交流群
回答错误了,看看结果

使用道具

板凳
RZZ 发表于 2013-8-20 09:59:30 |只看作者 |坛友微信交流群
看看

使用道具

报纸
RZZ 发表于 2013-8-20 09:59:56 |只看作者 |坛友微信交流群
看看先

使用道具

地板
glhydxz123 发表于 2013-8-21 19:03:15 |只看作者 |坛友微信交流群
看看先

使用道具

7
c362803668 发表于 2013-8-22 16:32:18 |只看作者 |坛友微信交流群
学习

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 10:22