楼主: luzhanjie
13306 55

[演化博弈] 一个难倒亿万人的问题 [推广有奖]

11
Mestra 发表于 2007-1-11 14:08:00
以下是引用guogrant2000在2007-1-11 13:45:00的发言:

楼上给出的思路确实新颖呀,佩服。可是如果1号和2号选择的和是40,那么三号还是可以推知他们最可能选的是每人20,因为2号是可以确切知道1号选择多少的,所以他以自己利益最大化,不会选择的与1号偏离太远。所以我认为后面的人在选择时,他们有的选择概率中有一个最大概率问题,而这个最大概率可能就是他们选择的结果,那么他们都还得死。

呵呵,个人观点。

"可是如果1号和2号选择的和是40,那么三号还是可以推知他们最可能选的是每人20"

当每次说“最”这样的词汇的时候要小心,“最”就是一种极限状况,也就意味着一种解得状况。“最大概率”什么的需要足够的证据支持,没有证据的“我认为”是不可靠的

“如果1号和2号选择的和是40,那么三号还是可以推知他们最可能选的是每人20。” 如果是这样的话,三号的推断将是主观推断,博弈将变成贝叶斯信念下的序贯均衡。如果在一号选择之前,博弈没有“历史”,那么没有理由认为三号有主观信念,也就不存在“最可能”的推测

没有历史的博弈,因此不得不假设从1号开始每个人都以平均分布的概率决定在可选范围呢选择一个数

这种方法的关键就是求出每个人的选择范围,剩下的就是纯计算问题

12
chrysalide 发表于 2007-1-11 23:15:00

楼上的观点,我还是不太赞同。就以你举的最简单的例子,若是1号选5,2号选7,那么他们总共拿走了12粒。那么对3号来讲,前面两个人的组合是1+11,2+10,3+9,4+8。。。。。。若是这种情况下,那么3号肯定会选6粒,因为如果前面两个人不是6+6的情况的话,那么6粒就介于1号和2号之间,那么3号肯定不会死!!那么对4号和5号来说,肯定也如此。再来注意假设的第一条,每个人都是很聪明的!所以,这样肯定能断定1号和2号不会作出这样的选择!

而且楼上说的没有博弈“历史”,对这个问题应该是在重复博弈的情况下产生,而这个题目是一次有序的博弈问题。所以,“历史”的说法在这里应该不适用吧?

13
Mestra 发表于 2007-1-11 23:36:00

假设一号拿了5二号拿了7

三号只知道他们一共拿了12,所以2+10,3+9,4+8,5+7,7+5,8+4,9+3,10+2对于三号而言只能是等概率的事件

对于三号,在知道了前面一共拿走12的情况下,一号拿5二号拿7的概率是1/8。

这个问题的关键是第n(n〉2)号只知道前面一共拿走了多少,而不可能知道前面每个人拿了多少,三号只能凭概率去判断,这个概率是服从平均分布的。

14
chrysalide 发表于 2007-1-11 23:42:00

为什么老是追着概率不放呢?就算3号知道1号和2号加起来拿了12粒,可是他的最优反应还是拿6粒啊?跟概率没什么关系吧?

15
Mestra 发表于 2007-1-12 00:15:00
以下是引用chrysalide在2007-1-11 23:42:00的发言:

为什么老是追着概率不放呢?就算3号知道1号和2号加起来拿了12粒,可是他的最优反应还是拿6粒啊?跟概率没什么关系吧?

恩恩,确实我的解法有问题。尚待深思

“假如一号选择了5个,2号不会选择4个或6个”我这一条说明肯定是错了。这样一号选5的条件下看来二号的选择空间需要进一步斟酌。如果这一条被推翻的话,三号选择一号和二号和的平均数未必是最优的。(简单的例子是一号选5二号选6)

我的错误在于只考虑向前推测,没有考虑向后推测。稍加修正后,直观上3号和5号的存活几率比较大(夜已深,来不及深思,在进一步的计算之前不好说3号比5号更可能生存,或者相反)。

“问他们中谁的存活几率最大?? ”题目是这么问的,那么可能就是解出来每个人存活的概率,谁的概率大存活的几率就大

“为什么老是追着概率不放呢?”我直觉上觉得划分各自的选择域,按照平均分布的概率选择,最后以条件概率求值是一条比较可行的路

当然,还有另一条路就是先验的假设概率分布函数作为各自的策略集,同时写出每种条件下的每个人的支付函数,1-5号各自对自己的支付函数求最大值。这种方法更麻烦一些,我的直觉是“平均分布”的概率密度是最有可能出现的。

上文用了两个“直觉”是因为我实在是个懒人。。。懒得拿笔算一下。。。

[此贴子已经被作者于2007-1-12 0:17:46编辑过]

16
kgandyjay 发表于 2007-1-12 09:54:00

我的思路如下:

这有点像海盗分宝石,用的是逆推法

一、假如1号选择的是50—95中的任意数,那么将会(X,2—47,1,1,1)

二、假如1号选择的是34—49中的任意数,那么将会(X,2—33,33—2,1,1,)

三、假如1号选择的是21—33中的任意数,那么将会(X,Y,Z,G,K),其中K>1

四、假如1号选择的是1—20中的任意数,那么5个海盗死的概率是一样的。

总上所述,1号和5号死的概率是一样的,即100%,2号不死的概率是75%,3号不死的概率是29%,3号死不死的概率是13%。

上述是提供一个思路,望大家再指点。

17
Mestra 发表于 2007-1-12 12:50:00

“2,他们的原则是先求保命,再去多杀人 ”

楼主你确信真的是这条原则?

而不是“2,他们的原则是先求保命,再去多救人 ”

我思考了下,如果是“多杀人”,则均衡是一起死;如果是“多救人”,则1号和5号必死,2-4号能活下来。

18
wesure 发表于 2007-1-12 13:39:00
都想救人的话,前两个死,轮不到第5个了

19
zzzrayne 发表于 2007-1-13 19:07:00

太复杂,没有理出头绪

20
hust_yxmsdl 发表于 2007-1-14 15:37:00

给定囚犯的上述秉性和处罚规则,囚犯的存活几率同为0。

具体推断过程:
第一,无论1号和2号如何取数,其他囚犯取数的严格最优策略必定是前面取数之和的平均数,不能整除则取整。如果剩下数字不足前面的平均数(5号不会碰到这种情况),则全部取走,因为囚犯乐见别人死;

第二,2号自然清楚后三个囚犯的最优策略,因此他必定会取小于1号的邻数,只有1号取1这个极端值时他才可能取2,这样可以指望别人犯错(当然犯错是不可能的);

第三,前面推断的结论就是1号必死,给定这个结局,1号必定取足100粒,他固然最多,而其他囚犯则只有0,同为最少,大家一起死。1号这样取的另一个可能的动机是一个人决定所有人的命运(如果这能带来某种满足感的话,现实和历史中不乏这种损人不利己的例子)。

如上推定,题目中的约束条件--不能交流--根本就没有意义,可以去掉的。

我倒是对微软出题的用意比较有兴趣,即该题的现实意义。微软是不是暗示应聘者一旦入选后应该对以后工作团队中能力较弱贡献较小的成员宽容一点呢?如一个人为的例子:某个实行末位淘汰制的团队(很常见),另外有个规则,即除末位者外还要清楚一位成员出去,譬如理由是缺乏团队合作精神(也较为常见的吧?),再给定人自私本性是妒贤,即见不得别人比自己好(不是很常见,但现实中仍不乏这样的损人不利己的例子),那么是不是就会出现该题中的情况呢?

欢迎大家指正。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 11:03