楼主: kedemingshi
1329 25

[量化金融] 扑克诉讼游戏 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-9 04:05:29
为了验证这个猜想,我们考虑了三种不同的处理方式或诉讼场景:(i)案例#1,当玩家的私人卡的价值等于t时(换句话说,当玩家有一个“边缘”或接近的案例,在这个案例中,他赢的可能性和输的可能性一样大);(ii)情况#2,当他的洞牌的价值低于t的某个未知量x,或t–x(即当玩家有“弱”情况时);和(iii)情况#3,当他的洞牌价值超过阈值t×x或t+x时(玩家有“强”情况)。4.1. 案例#1:t假设一个给定的玩家(例如,玩家P,原告)喜欢对冲他的赌注:当他的洞牌的价值大于或等于某个阈值t时,他下注高a,当他的牌低于该阈值时,下注低b。36简单地说,这种策略背后的直觉是,一个人应该下更大的赌注,一个人的牌越强,以使自己的收益最大化,因为当一个人有一张强有力的牌时,他赢得比赛的几率就越高。37现在,假设玩家P的牌的价值等于t,另外,假设他的对手,玩家D,也喜欢对冲他的赌注。38玩家P必须考虑两种可能的情况:玩家D的牌大于t(在这种情况下,玩家D下注高,a)或小于t(在这种情况下,玩家D下注低,b)。如果玩家D下注低b是因为他的洞牌小于t,那么玩家P将赢得+b,无论他是玩家P下注高还是低。

12
何人来此 在职认证  发表于 2022-5-9 04:05:34
相比之下,如果玩家D的牌的价值大于t,那么玩家P将输掉赌注(无论他,玩家P,已经下了高赌注还是低赌注),但是因为玩家P在这种情况下下注高时输得比下注低时多,所以在这种情况下,玩家P应该选择低赌注,以尽量减少他的损失,因为!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!34!见McAdams,前注9。!35!纳什,前注10,第293页。!36!作为参考,我们将此策略指定为“m型”策略或混合策略。!37!相反地,一个人应该在较弱的牌上下较小的赌注,以尽量减少自己的损失。!38!正式声明,假设玩家D也是m型玩家。也就是说,假设玩家D对玩家P的m型策略与玩家P对D的m型策略相同。!!8.b<a.但请注意,当玩家P的洞牌价值大于或等于阈值t时,这种偏好与玩家P的高赌注策略不一致;因此,对于玩家P来说,混合策略或m型策略不可能是均衡策略或最佳反应。该分析将我们引向游戏中更大的一点:一个玩家即使有一张高价值的洞牌,也可能会输,这取决于另一个玩家的洞牌,因为游戏的最终结果取决于两名玩家的洞牌各自的价值(相反,一名玩家即使持有低价值的洞牌,仍然可以获胜)。换句话说,就像诉讼一样,玩这个游戏和下注都是有风险的活动,因为高下注(和低下注)会带来成本和收益。在均衡中,这些成本应该等于收益,因此我们继续定义这些成本和收益,以找到这个博弈的均衡策略。

13
nandehutu2022 在职认证  发表于 2022-5-9 04:05:37
首先,假设玩家P的牌的值等于t,而另一个玩家的牌(玩家D的牌)大于t,这一事件发生的概率为1–t。39因此,玩家P将输掉游戏,无论他下注高还是低,但他输了–a当他下注高,b当他下注低。(也就是说,在这种情况下,玩家P损失了额外的金额,a和b之间的差额,这个差额损失等于b,因为我们之前假设a=2b。)因此,从玩家P的角度来看,在这种情况下进行高赌注的真正成本a是b(1–t)。接下来,假设玩家D的私人卡低于阈值t,这是一个概率为t.40的事件。同样,假设玩家D在这种情况下以概率p下注高。在这种情况下,当玩家D下注低时,玩家p赢+b(玩家D下注低的值),无论玩家p自己下注高还是低。但是,当玩家D下注高(概率为p的事件)时,玩家p赢+a(或2b,因为a=2b)。41因此,在这种情况下(即当玩家D的牌低于t时)下注高对玩家p的好处可以正式表述为:(b+a)(t)(p),或3b×t×p(因为a=2b),或3btp!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!39!参见上述规则#2。!这个事件发生的概率为1–t,因为我们假设游戏中每个玩家的牌的可能值在区间[0,1]上是独立且相同分布(i.i.d.)的随机变量。因此,如果t是玩家P或D的牌等于t的概率,那么1–t是玩家D的牌大于t的概率。!40!见前注39。

14
大多数88 在职认证  发表于 2022-5-9 04:05:40
这个事件发生的概率为t,因为根据定义,如果玩家D的牌高于t,概率为1–t,那么他的牌将低于t,概率为t。!41!顺便说一句,值得一问的是,为什么玩家D会用低值卡赌高?因为如果玩家P下注低而不是高,那么玩家D就会赢+b而不是输-a。!!9!在均衡状态下,在两种情况下进行高赌注的成本和收益必须相同:b(1–t)=3btp,或等效(简化后):1/t=1+3p。此外,在均衡状态下,这种等式不仅必须在阈值t处成立,而且必须在t上方和下方的任何地方成立。因此,我们考虑两种额外的情况或案例:下面第4.2小节中的案例#2,当一名球员的洞牌价值低于t(即当该球员有“弱”情况时),以及第4.3小节中的情况#3,当他的牌超过t(当他有“强”情况时)。4.2. 案例#2:t–x我们现在开始确定一名球员的最佳策略或最佳反应,当他的洞牌价值小于t时。为了简单起见,从球员P的角度考虑第二种情况。42假设玩家P的私人卡的价值低于阈值t的未知量x,或t–x。总之,玩家P的策略集中有两个选项:他可以进行高赌注、a或低赌注,b.但是,与第一种情况下(即,当玩家P的私人卡价值等于t时)相比,在这种情况下,玩家P对每种策略的回报是什么?总之,如果玩家P在第二种情况下下注高(即当他的洞牌的价值为t–x时),那么只有当满足两个条件时,玩家P才会输-a,而不是赢+a:当(i)玩家D的私人洞牌的价值在间隔[t–x,t]上时,(ii)玩家D下注高。

15
kedemingshi 在职认证  发表于 2022-5-9 04:05:44
由于玩家D在这个特定场景中(即当他的洞牌位于区间[t–x,t])以概率p乘以x下注(回想一下,假设玩家在洞牌的值低于t时以概率p下注),在这种情况下,玩家P的回报比在第一种情况下(当玩家P的洞卡值等于t时)的相同情况下低-2apx(或等效地说:-4bpx,因为a=2b)。然而,如果在第二种情况下,玩家P下注低,那么只有在满足两个条件时,他才会输-b而不是赢+b:(i)当玩家D的牌的价值在区间[t-x,t]上时,以及(ii)当玩家D下注低时。由于玩家D将以低概率(1-p)x下注,玩家p的回报现在是-2b(1-p)x,比第一种情况下发生相同情况(阈值=t)时低!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!42!然而,回想一下,我们的分析也适用于玩家D,因为这个游戏中的收益是对称的。!!10!接下来,为了找到玩家P的最佳反应,我们将玩家P对两种策略的修正收益设置为彼此相等,并简化如下:43 2p=(1–P),或者简单地说,P=1/3,在高下注和低下注之间随机选择是给定任何小于t的牌的最佳反应。或者,正式声明,只有当另一个玩家以1/3的概率下高赌注时,玩家(玩家P和对称的玩家D)才会对x的所有值进行高赌注或低赌注。否则,如果其中一名玩家下注概率大于或小于1/3的高赌注,另一名玩家可以相应调整其下注策略以增加其收益(或减少其损失)。

16
mingdashike22 在职认证  发表于 2022-5-9 04:05:47
此外,假设p=1/3,当我们用这个值代替原始平衡方程中的p,1/t=1+3p,并求解t时,我们看到t=1/2或0.5。因此,最佳阈值为0.5,当洞牌的值低于该临界阈值时,玩家应以1/3的概率高下注(或以2/3的概率低下注)。4.3. 案例#3:t+x最后,我们希望确认一个玩家的最佳策略(最佳反应),当他的洞牌的价值大于t时。同样,为了简单起见,从特定玩家的角度考虑第三种情况,玩家P,虽然同样的分析也适用于玩家D,因为这个游戏是对称的,但现在,假设玩家P的私人卡的值超过阈值t的未知量x,或t+x。与之前一样,玩家P在这个游戏中有两种可能的移动(即他可以进行高赌注a或低赌注b),因此在这种情况下(即当玩家D的卡的值位于间隔[t,t+x]),我们继续寻找玩家P在每种策略下的收益,并将其与第一种情况下的收益进行比较(当阈值设置为t时)。如果玩家P在这种情况下下下了高赌注(即,当他的牌超过t的数量x时),那么当玩家D的牌的价值在区间[t,t+x]上时,他会赢+a而不是输-a,因为根据假设,当他的牌大于t时,玩家总是下高赌注a。因此,在这种情况下,玩家P的收益比第一种情况下(阈值=t)发生相同情况时的收益高+2ax(或者,因为a=2b,所以高+4bx)。

17
nandehutu2022 在职认证  发表于 2022-5-9 04:05:52
然而,如果玩家P在这种情况下下注较低,他将赢得+b,这与他在第一种情况下(当阈值=t时)在相同的两个条件满足时在这种情况下赢得的金额相同:当(i)玩家D的洞牌值小于t,并且(ii)玩家D下注较低。因为这些都是玩家P在第一种情况下获胜的条件,玩家!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!43!我们将这些“t–x”收益设置为彼此相等,因为在均衡状态下,一个玩家(玩家P和对称的玩家D)应该在高赌注和低赌注之间保持中立。!!11!P在第三种情况(情况#3)中的收益与在情况#1中发生相同情况时的收益相同。在区间[t,1]中,高赌注的回报是增加的,低赌注的回报是恒定的,因为根据定义b=b,玩家P(以及对称的玩家D)严格地喜欢在洞牌的价值高于t时高赌注。此外,由于这是一个对称的游戏,同样的结论也适用于玩家D,根据我们游戏的规则和支付结构,当一名玩家的私人卡价值低于t时,他应该以1/3的概率高下注(或以2/3的概率低下注),而在所有其他情况下,他应该以高下注。5.结论在结束之前,我们希望承认并谈谈我们扑克诉讼游戏的人为性,44或者用Nate Silver的话说,我们希望解释为什么我们的模型“复杂而简单”45不可否认,我们的扑克诉讼游戏是一种更复杂活动(民事和刑事诉讼)的简单表现或模型,但出于几个原因,节俭和简单也是一种美德。46一个是易处理性。一个简单的模型比“现实世界”更容易分析和使用。

18
nandehutu2022 在职认证  发表于 2022-5-9 04:05:55
也就是说,扑克(或诉讼)的一种更简单的表现形式比正在建模的真实世界游戏更容易处理,或者用博弈论创始人约翰·冯·诺依曼和奥斯卡·莫根斯特恩的话说,“真实的扑克(就像我们要加上的真实诉讼一样)是一个非常复杂的主题,无法进行详尽的讨论。”47简洁的另一个优点是清晰。创建一个简单模型的过程需要我们识别参与者及其策略集,明确定义我们的术语,明确陈述我们的假设,与纯粹的口头描述现实不同,正式模型允许我们对现实世界做出可证伪的预测。但最重要的是,一个简单、设计良好的模型可以捕捉到在更复杂的现实世界中存在的战略互动的本质。具体来说,我们简单的诉讼模式可以帮助我们隔离和展示法律程序的一些基本特征。在本文中,我们提出了一个简单的诉讼过程模型,即“扑克诉讼游戏”,其前提是诉讼有很多好处!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!44!见冯·诺依曼和摩根斯坦,前注15;另见纳什,前注10;另见Nash&Shapley,前注19;另见库恩,前注14(所有人都发明了简化扑克游戏,以阐明博弈论的基本原理)。!45!NATE SILVER,《信号与噪音:为什么这么多预测都失败了——但有些预测却没有。——225(2012)。!46!例如,见冯·诺依曼和摩根斯坦,前注15,第186-88页;另见F.E.Guerra Pujol,《波多黎各地位辩论和其他立法消耗战的博弈论分析》,上午18点。《纽约大学性别社会学》。POL\'Y&L.625630-31(2010)。!47!冯·诺依曼和摩根斯坦,前注15,第186页。!!12!常见于扑克游戏。

19
可人4 在职认证  发表于 2022-5-9 04:05:58
总之,我们的简单模型是有用的,因为它分离出了游戏的两个重要变量:(i)每个玩家在其案例中的赌注大小或投资水平(由变量a和b捕获),以及(ii)其案例的相对强度(由变量t捕获)。此外,我们的模型为琐碎索赔(或“负预期价值”诉讼)以及检察官不当行为的存在提供了另一种解释,因为我们的模型的主要教训之一是(从玩家的角度来看),扑克诉讼游戏中存在最佳程度的虚张声势,虚张声势的定义是,即使自己的实力较弱,也有可能或随机下大赌注。但在我们的游戏中,这种最佳的虚张声势是什么?考虑到我们游戏的规则和支付结构,当一个人的私人卡价值低于临界阈值0.5时,最佳水平是以1/3的概率高下注。同样地,在现实世界的诉讼游戏中,我们希望虚张声势(即轻率的索赔)的最佳水平是两个变量的函数:(i)风险金额,或在我们的模型中,赌注的总和,以及(ii)玩家P和D案例的相对优势和劣势。!13!致谢首先,作者要感谢Jeffrey Ely在cheaptalk上发帖。org David McAdams的扑克游戏(“世界上最简单的扑克”)以及McAdams简单而优雅的游戏解决方案。顺便说一句,除了一个,所有针对伊利教授最初的博客帖子(包括我自己的解决方案)发布的解决方案都是错误的。(关于我最初解决游戏的失败尝试,请参见附录。)我还必须感谢Ely教授和McAdams教授在假期里抽出时间回答我关于McAdams模型的技术问题。

20
kedemingshi 在职认证  发表于 2022-5-9 04:06:02
2012年年终假期,我在佛罗里达州库珀市我亲爱的朋友雷纳德和拉坦亚·达蒙的家里,在佛罗里达州塔彭斯普林斯我亲切的姻亲厄尔和安德里亚·罗宾逊的家里,在加利福尼亚州格伦代尔我慈爱慷慨的父母弗朗西斯科和奥伊达·格拉的家里,开发了我的扑克诉讼游戏,并撰写了本文的初稿。因此,我还要感谢格拉斯夫妇、罗宾逊夫妇和达蒙夫妇的好意、支持和款待。最后,我要感谢我的妻子Sydjia Guerra对我论文中的数学进行了校对和复核。(我的封面上的图片由维基公共资源提供,可在http://commons.wikimedia.org/wiki/File:Holdem.jpg.)参考书目贝尔德、道格拉斯·G、罗伯特·H·格特纳和兰德尔·C·皮克(1994),哈佛大学博弈论与法律。比林斯、达斯、亚伦·戴维森、乔纳森·谢弗和杜安·萨夫隆(2002),“扑克的挑战”,人工智能,134:201-240。尼尔·杜克斯伯里(1999),随机正义,牛津。Ely,Jeffrey(2012),“伟大的预备问题:世界上最简单的扑克游戏”,博客,2012年11月20日,在线提供,URL=http://cheaptalk.org/2012/11/20/great-prelim-question-worlds-simplest-poker-game(最后一次访问时间为2012年12月12日)。Gilson,Ronald J.和Robert H.Mnookin(1994),“通过代理人的争议:诉讼中律师之间的合作和冲突”,《哥伦比亚法律评论》,94(2):509-566。Guerra Pujol,F.E.(2010a),“科斯与宪法”,里士满法律与公共利益杂志,14(4):593-609。Guerra Pujol,F.E.(2010b),“波多黎各地位辩论和其他立法消耗战的博弈论分析”,《美国大学性别、社会政策和法律杂志》,18(3):625-648。格拉·普约尔,F.E。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 01:21