接上页
A: 对于这个题目,您现在可以给出答案了吗?
别告诉我无解循环啊。
B: 就是循环啊。就像是石头剪刀布,这样循环下去的结果就是没有pure strategy NE
因为所有的结果都有deviate的动机,所以只能让自己unpredictable。如果研究这个题目的mix strategy NE (根据定理应该是存在的),将会更加有意思和难度~当然,只考虑pure的话,结果就是not exist
A: 那我们再看看这个解释有什么问题:
甲出价为X,乙出价为Y。
假定甲给定一个X,那么乙选择的Y落在0到X的范围内的概率是X/101,落在X到100的范围内的概率为(101-X)/101。
X>Y时,则甲的收益为100-X。该收益发生的概率为X/101;X<=Y时,则甲的收益为-X。该收益发生的概率为(101-X)/101。
那么甲的收益期望值为P=(100-X)*X/101+(-X)*(101-X)/101=-X/101。
同理可得,乙的总效用函数P=-Y/101。为减函数,所以应该出0。
B: 这是belief的问题。问题出在,Y落在0到X的不是uniform的distribution。因为这不是Y的策略。
如果举一个更极端的例子,我作为X就认定了Y一定会选0,那么此时1就是最好的策略。同理,如果我认定Y一定选1,那么2就是最好的策略。成为equilibrium的条件式,belief要是correct的!也就是说,x对y的belief和y实际采取的(mixed)的策略,必须要是一致的。
并不是任意一个belief justify了我的选择,那么我就能安心的选这个结果了~所以还是要“两厢情愿”。
我的belief(或者说我计算我期望效用的概率)要和你的实际策略相符。你的belief也和我的策略相符。
同时在这种情况下,我和你的strategy的payoff还都是最大的,这样才能构成一个均衡
A: 是啊,概率可能不是均匀分布的。
这种说法有问题吗?——因为甲、乙都想得到最大的收益,甲希望的是X>Y,乙希望的是Y>X,但是不可能同时满足这个条件,而2人都是理性的,所以只有当X=Y时达到均衡,且双方叫价为0收益最大,否则收益一定为负。
B: “所以”的依据是?X=Y不是均衡,never是。不能说我想比你高,你想比我高,那么我俩一样高就是最好的结果啊~因为这个问题很残酷,我比你高或者你比我高,至少有一个人得100,而我们相同得结果会是0.
理性,是得不到x=y得结果的。所谓的理性,大概指的是效用最大化。一般我们考虑的是理性+信息(common knowledge)。这两个前提条件都得不出x=y的结果的啦~
A: 您说:“就是循环啊。就像是石头剪刀布,这样循环下去的结果就是没有pure strategy NE”,问题是您只有一次选择机会,如何循环?
(0,0)的确不满足纳什均衡的定义,但当您只有一次出价机会时,您会在[0,100]中做何选择?为什么?
B: 循环的意思可以理解为双方无法达到共识,没有一个稳定的状态。
NE只是理论上的solution concept,但是实际上人们未必会表现出play NE。就像物理学告诉我们推一下,这个东西就应该一直直线运动下去,但是事实上很难/不可能发生。
如果要讨论solution concept的话(或者说理性人“应该”)如何选择的话,那就会使用mixed strategy了,就像石头剪刀布里面,1/3 1/3 1/3的概率。这里构造mixed strategy我还没有细想,但是毋庸置疑,均衡状态就是mixed的。
至于人们“会”如何play,这是behaviour上面的东西,也是研究的难点。game theory只是告诉我们,理论上的optimal,或者说should play.
behavior上更像是 will play
如果您还是想问我会如何选择,我会给以下几个选择:
如果我心情好,想表现得最优,那么我会根据理论上得mixed来play(但是实行上仍然有难度)
如果我十分保守,害怕亏钱(特别是给定一定的ndowment),那么我可能会选0.
或者,我就是喜欢3这个数字,那么我选择出3.
真正要预测人的行为很难得,只能说,理论上说,最Optimal的选择(基于期望效用)就是mixed strategy(第一种)。其他的选择也是可能的。
可以理解为,"理论"告诉我们要天天学习,不要玩游戏,不要xxx。但是"实际上",有人会这么做,但是有人完全不这么做,有人部分这么做~
A: 您所说的混合策略纳什均衡是怎样的呢?纳什说纯策略均衡不一定有,但混合策略均衡总是存在的。
至于您说的明知学习重要,却不肯放弃玩耍,那是理性不足的表现。博弈论的研究前提是所有局中人都是理性的。非理性的行为,要放到行为博弈中去讨论了。这是两个不同的体系。
您说:"我就是喜欢3这个数字,那么我选择出3."请问这是一个理性人的行为吗?
您的意见对我有启发,谢谢您!只是还觉得不过瘾,仍然没有从根本上扭转我对(0,0)的偏好。我之所以提供这个题目来讨论,就是因为(0,0)不符合纳什均衡的定义,却被理性人选择,具有稳定性,也许博弈论无法解释,而要用风险理论或其他什么理论来解释。我一直不能理直气壮地、完美地解释它。
B: 可以这样认为:理性人假设是maximize他自己的utility的。那么我们传统的utility都是期望效用、期望收益,这也是nash equilibrium所采取、关注的payoff。0,0是另一个概念(minimax),在这种情况下,其实关注的是自己收益的最小值。如果自己是理性的+关注的utility是收益的最小值(而不是收益本身),那么0,0就是理论预计的答案了。
混合策略容我想想。
混合策略在离散情况下并不复杂。不知道您熟不熟悉混合策略的解法(比如一个2x2,或者3x3的game)。如果熟悉的话,那就好办了:把他们的strategy列成101X101的矩阵,每个格子里填上对应的payoff。
比如第一行0,0 0,99 0,98 .... 0,0
第二行 99,0 -1,-1 -1,98, ... -1,0
一直写满整个101X101的矩阵,然后想当于转换成100个未知数,100个方程的方程组,就可以解出每个策略的p_i了。这也是解一般Mixed strategy的方法。如果您乐意自己动手,可以编程算一下。如果只是要结果,我也可以offer一个程序
连续情况,可以参考all pay auction的equilibrium,其中v_a v_b都是100.
A: 混合策略的思想我可以接受(此前我们讨论的是纯策略),编程我恐怕难以胜任,请您把程序发给我:
whe58@sina.com,我抽空算算。您的程序不会是Gambit.exe吧?此程序我有
https://bbs.pinggu.org/thread-2126359-1-1.html。
B: 不是啊。我的意思是随便写个程序啊。。。你那有什么语言?matlab或者R都可以写一个
A: 那我还是用Gambit.exe吧。这可是一个有101个元素的概率集合啊!而且两人的混合策略完全一样。
我一直考虑纯策略,是您提醒了我可以考虑混合策略。但混合策略在现实中操作性将大打折扣。
B: 是的。我已经说过啦,这个game不存在纯策略均衡,只有混合策略的。所以对现实的prediction效果不好,尤其是1 shot game。
——完