首先,第三期题目:
问题1: 给定4位单身男生a, b, c, d, 以及4位单身女生A, B, C, D。他们对对方都有一个偏好排序(1>2>3>4), 可用如下矩阵表示:
...
那么,聪明的你能找出一个“稳定”的匹配么?请给出你的思路/方法。
这个题目是一个经典的题目,若干年前我就看过一个关于这个问题的讨论,并且近期受这个贴子的启发,看了下那本书(真的不错)的相关章节,才给出了这个题目。这个题目的用意是,版内有很多不错的资源、讨论,如果大家能多看看贴子、参加讨论,相信能够收获不少。
鉴于两位参与者都给出了正确的答案,所以这里不给出具体细节,对这个问题感兴趣的同学推荐看看那本书~
这期的问题我感兴趣的是第2个问题和第3个问题:
问题2: 下面考虑“换室友”问题,4个男生a b c d对其他男生都有一个偏好排序,如下面矩阵所示:
a,b,c,d 四人将分成两对、成为室友,那么是否存在稳定的室友匹配呢?
问题3: 上面两种问题有什么区别与联系?
可惜的是,没有人就这两个问题(2和3)给出了回答。(欢迎有想法的同学跟贴交流、探讨)
——————————————————————————————————————————————————————————
下面,第四期题目:
一位熟读博弈论的同学小C邀请你参加下面的赌局:
你和小C各拿出一枚硬币,每人都可以独立选择正面或背面朝上,用手盖住;待双方都做完选择后同时揭示选择:
若两人选择都是正面(Head),则你(从小C处,下同)赢取20元;
若两人选择都是背面(Tail),则你赢取x元;
若两人选择为一正一背面(1H1T),则你将输掉(输给小C)40元。
(假定双方都是理性人,追求金钱最大化)
问题:试用博弈论方法分析,当x分别为50,60,70时,你是否愿意参加这个赌局?为什么?
这个题目就涉及到我想澄清的一个概念,计算期望收益的时候一定要找到对应的概率分布!
本帖隐藏的内容
硬币的例子有点迷惑人,因为首先想到的就是1/2的分布,并且在经典的matching pennies例子中算出的均衡确实是1/2,然后得到了matching pennies是零和博弈(zero sum game),并且(碰巧)每个人的期望收益都是0,所以game可以看做是fair的。这个题目,虽然也是零和博弈,但是如果我们算出这个game中每个人的期望收益,发现并不是都是0的。
为了计算期望收益,我们需要首先找到NE,(得到概率分布),然后再计算每个人的期望收益,具体步骤如下:
1. 写出payoff matrix,由于是零和,省略另一个人的收益:
20 -40
-40 x
混合策略均衡会使得对方选H和T的收益相等,20*p+(-40)*(1-p)=-40*p+x*(1-p)。以x=70为例,可以算出p=11/17.
同理,我们可以算出q=11/17.
2. 给定了双方的策略p=q=11/17,我们就可以算出每个人的期望收益了。事实上,由于选H和T的收益相等,所以任何mix的收益(对手play Nash)的时候=选H的收益=选T的收益,所以期望收益为: 20*11/17+(-40)*6/17<0(对于“我”)。
对于对手(C),类似的,他的期望收益是-Y(假设我的期望收益为Y)
所以我们可以看到,这个game对于“我”来说,期望收益是小于0的,所以不应该参加(无论x=50,60,70)。
3. 那么x=?的时候才是真正的“临界点”呢,答案就是x=80. 其实临界的时候刚好应该是两人的期望收益都是0.所以就方程:
20*p+(-40)*(1-p)=-40*p+x*(1-p) 左边来看,可以得到p=2/3。右边也等于0,即可得到x=80。
总结:这个题目告诉我们,不要被表面上的熟知的1/4 1/2 1/4的“经验分布”所迷惑。考虑期望收益的时候,一定要想清楚“概率分布”到底是什么。
其实,只有当自己计算期望收益的分布(猜的分布)与其他人选择的概率一致的时候,自己的选择才能站得住脚(justified)。如果我假设你一定选T,那么我选T就是最好的,但是这并不是NE,因为假设(你一定选T)是不“一致大”(consistent),你的最优选择并不是“一定选T”。
欢迎跟贴交流讨论~希望每周1题活动能有更多人参与~第五期活动传送门...