楼主: mingdashike22
4628 120

[经济学] 数学博弈论 [推广有奖]

51
可人4 在职认证  发表于 2022-4-24 19:26:59
回报率也用1:ρ表示,称为下注的od ds。赌徒的预期收益(每欧元)isE=ρPr(A)+(-1)(1 - Pr(A)=(ρ+1)Pr(A)- 1.所以(-E) 是收受赌注者的预期目标。如果赌徒和庄家的预期收益相同,即e=-因此E=0成立。换句话说:1:ρ是公平的<==> ρ =1 - Pr(A)Pr(A)如果投注者不知道真实概率Pr(A),则需要对其进行估计。假设投注者对PR(a)的期望是p,则下注(主观)有利,当且仅当(33)e(p)>0时,即,如果ρ+ 1>1/p,赌注者将考虑几率1:ρ为公平IFE(p)=0,因此ρ+1=1/p。下注者不会期望在下注时获得收益,而是期望在下注时遭受损失——基于导致概率估计p为Pr(a)的信息。3.1。例子。让我们来看一些例子。例4.5(德梅尔的游戏)。假设一个事件没有“6”显示,如果一个单六面模具滚动四次。假设A的赔率为1:1。如果赌徒认为所有结果都是相同的,则g ambler对A的概率f的估计==≈ 0.48 2<0.5参考B.PASCAL(1623-1662)3。公平的OD DS 59,因为在di e的4个Roll上有6=1296个可能的结果序列,其中5=625对应于A。因此,玩家应该期望一个负urn:e(p)=(ρ+1)p- 1=2p- 1 = 2(5/6)- 1 < 0.相比之下,如果一对骰子掷了24次,就让A成为没有双6显示的事件。现在,潜在赌徒估计Pr(~A)为~p=(35/36)>0.5。因此,A的赔率为1:1会让赌徒期待一个正确的结果:~E=2~p- 1 > 0.例4.6(轮盘赌)。设W={0,1,2。

52
大多数88 在职认证  发表于 2022-4-24 19:27:06
,36}表示轮盘赌,并假设0∈ W为绿色,18个数字为卫红,其余18个数字为b。假设一个数字∈ W是通过旋转轮子并让球停在其中一个数字上随机确定的。(a) 修正w∈ 事件Aw={X=W}上的ODDS1:18。在赌Aw时,阿甘布勒是否应该期待正回报?(b) 假设银行对事件R={X=red}给出1:2的赔率。赌徒是否认为这些可能性对公平?3.2. 加倍策略。对于轮盘赌(见例4.6)和赔率为1:2的类似投注游戏,大众智慧建议根据以下策略进行重复投注:(R)在R={X=red}上下注1。如果R没有出现,则继续在R上下注双倍金额2。如果R没有出现,则再次加倍,并在R上下注4,依此类推,直到事件发生。一旦R显示,一个人在原来的1号投资上的净收益为1(见Ex.4.7)。R不在一圈内发生的概率是19/37。因此,在一个同样平衡的单轮的前n个旋转中的e个旋转中看到红色的概率很高:1- (19/37)北→ 1(n)→ ∞).因此:策略(R)a很有可能实现1的净收益。我年轻时从我叔叔Max60 4那里学会了策略(R)。我在自相矛盾地期待和改进(?),在事件R上下注任何金额x>0的预期净收益始终为负,然而:ER=2x- x=-x<0。例4.7。使用平衡良好的轮盘赌游戏的展示:(1)如果仅在轮盘的第五个旋转上显示{X=red},策略(R)在前4个旋转上总共损失了15次。然而,在第五轮投资中,又投资了16项,然后赢得了2=32,这就产生了总体净回报率32- (15 + 16) = 1.(2) 前5次旋转发生{X=red}的概率大于95%。议论

53
mingdashike22 在职认证  发表于 2022-4-24 19:27:12
战略(R)的问题在于其风险管理。一个演奏家在实践中只能得到有限的钱。如果玩家希望将损失风险限制在B欧元,那么下注序列中的迭代次数将限制在mo st k,其中k-1.≤ B<2k,因此k=日志.因此:o可用预算B以概率(19/37)k损失。o投资组合以概率1增长到B+1- (19/37)k.4。押注于其他考虑到k m共同独家活动A,Ak-1.哪一家银行提供的赔率为1:ρ离子k事件Ai,这意味着:(1)银行提供的情景中,1/ρ离子是Aito发生的概率。(2) 如果事件发生,银行保证每欧元支付ρieuros。假设一名赌徒估计事件发生的概率PI>0,并决定将资本B=1全部投入。在这种情况下,(下注)策略是k元组a=(a,a,…,ak)-1) 人工智能的数量≥ 0以至于a+a+…+ak-1= 14. 押注于备选方案61,其解释是,当i=0,1,…,时,资本的收益将押注于事件的发生,K- 1.所以赌徒预期的策略a的对数效用isU(a,p)=k-1Xi=0piln(aiρi)=k-1Xi=0piln ai+k-1Xi=0pilnρi.注意p=(p,p,…,pk-1) 这本身就是一种策略,并且U(a,p)表达式中的第二个和项不取决于a的选择。因此,当一个人以最佳预期效用搜索一个策略时,只有第一个和项才有意义。定理4.1。设p=(p,p,…,pk)-1) 是赌徒的概率评估。然后:U(a,p)<U(p,p)<==> a 6=p。因此,a*= p是在赌徒期望下具有最佳对数执行力的策略。证据函数f(x)=x- 1.- ln x定义为所有x>0。

54
kedemingshi 在职认证  发表于 2022-4-24 19:27:19
它的导数f′(x)=1- 1/xis在x<1时为负值,在x>1时为正值。所以f(x)对于x<1严格减小,对于x>1严格增大,且唯一极小值f(1)=0。这就得到了等式为(34)lnx的伯努利方程≤ 十、- 1和lnx=x- 1.<==> x=1。应用伯努利不等式,我们得出(a,p)- U(p,p)=k-1Xi=0piln-ai-K-1Xi=0piln pi=k-1Xi=0piln(ai/pi)≤K-1Xi=1pi(ai/pi)-1) =k-1Xi=1ai-K-1Xi=1pi=0且相等当且仅当ai=Pi对于所有i=0,1,K62 4. 在测试和改进OREM 4.1的过程中,得出了具有最佳预期对数效用的设定规则:(BR)对于所有I=0,1,K- 1、将资本B的端口ai=Pi赌在事件ai上。不是贝尼。比例规则(BR)只取决于赌徒的概率估计值。它与1:ρithebank可能提供的特定赔率无关!很有可能。在定理4.1的证明中,我们可以看到:-1Xi=0pilnρi=-K-1Xi=0piln(1/ρi)≥ -K-1Xi=0pilnπ,当且仅当ρi=1/所有i=0,1,K- 1.因此,银行的最佳赔率(以及赌徒的最差赔率)由(35)ρi=1/pi(i=0,1,…,k)给出- 1).在这种情况下,赌徒期望最优策略p asU(p)=k的对数效用-1Xi=0piln pi-K-1Xi=0piln(1/ρi)=0。我们理解(35)中的赔率在使用替代方案下注的情况下是公平的。4.1. 统计频率。假设前几节中的赌徒已经观察到,在n个连续的下注实例中,该事件已经多次出现。因此,在s策略a下,原始的p组合B=1会发展成N(a)=(aρ)s(aρ)s·(ak-1ρk-1) sk-1具有对数效用un(a)=ln Bn(a)=k-1Xi=0siln(aiρi)=k-1Xi=0silin ai+k-1Xi=0silnρi.5。

55
大多数88 在职认证  发表于 2022-4-24 19:27:25
赌博和信息63基于观察到的频率,赌徒可以根据相对频率Espi=si/n(i=0,1,…,k)合理估计事件发生的概率- 1).就像理论证明一样。1,我们现在在hindsig ht中发现:推论4.1。战略a*= (序号),sk-1/n)将导致最大对数效用值UN(a*) =K-1Xi=0siln(si/t)+k-1Xi=0pilnρi,因此最大g rowthBn(a*) =(sρ)s(sρ)s·(sk)-1ρk-1) sk-1点5分。下注和信息假设下注情况为k选项a,a,Ak-1和赔率1:ρxas之前,假设事件轴已经建立,但下注者在下注之前没有此类信息。进一步假设信息现在通过某个(人工或技术)通信通道K到达,因此ou tcome轴向投机者报告(可能错误地)为Ay:x→ K→ y、 在收到“y”信息中的“内幕消息”后,投注者应该如何下注?为了回答这个问题,letp(x | y)=当接收到y时,真实结果为x的概率。请注意,这些参数p(x | y)通常是投注者对通道K信任度的主观评估。该信息设置中的投注策略现在是A(K×K)-矩阵x A,系数为A(x | y)≥ 0表示满意-1Xx=0a(x | y)=1表示y=0,1,K- 1.a(x | y)是在收到Axy时,押注在活动上的预算部分。具体而言,系数p(x | y)为64 4的投注者信任矩阵p。我正在测试和改进策略。对于Axis为真实结果的情况,因此期望对数效用Ux(A)=k-1Xy=0p(x | y)ln[a(x | y)ρx]=k-1Xy=0p(x | y)lna(x | y)+lnρx。在推论4.1中,我们发现所有x=0,1,K- 1:Ux(A)<Ux(P)<==> a(x | y)=p(x | y)y=0,1。

56
nandehutu2022 在职认证  发表于 2022-4-24 19:27:33
K-1.因此,最佳策略P是最优的(在投注者对K有一定信任的情况下),并且符合投注规则:打赌你的信念!信息传递。设p=(x,…,xk)-1) 是下注者对k事件A,A,…,的概率估计,Ak-1or,等价地,在eindex集合{0,1,…,k上-1}. 那么策略A的预期对数效用是相对于基数2:U(p)(A)=k的-1Xx=0k-1Xy=0pxp(x | y)loga(x | y)+k-1Xx=0pxlogρx.NOTA BENE。概率px是对事件Ai的可能性的估计,而概率p(x | y)是对投机者对通信信道K的可靠性的信任的估计。它们在逻辑上不相关。设定值(X)=-K-1Xi=1pxlogxH(ρ)=-K-1Xi=1ρxlogxH(X,Y)=-K-1Xx=0k-1Xy=0pxp(x | y)loga(x | y),因此我们认为-H(X | Y)- H(ρ)=U(p)+T(X | Y)6。常识65t(X | Y)=H(X)-H(X | Y)是由于通过信道K进行通信,投注者预期对数效用的增加。备注4.2(信道容量)。给定如上所述的信道K,传输概率p(s | r)和分布p=(p,p,…,pk)-1) 在信道输入x上,参数T(x,Y)是K的(信息)传输速率。在所有可能的输入分布p上最大化,得到信道容量C(K)作为可实现传输速率的最小上界:C(K)=suppT(x,Y)。参数C(K)在信息与通信理论中起着重要作用。例4.8。投注者预期该事件的概率为80%,而备选事件的概率为20%。应该下什么赌注?假设现在一位专家告诉bett或Ais肯定会发生。在专家被认为是正确的概率为90%的假设下,投注者应该下什么赌注?6.

57
kedemingshi 在职认证  发表于 2022-4-24 19:27:39
公共知识在讨论了有关博彩的信息之后,让我们离题一点,对信息和知识有一个更一般的看法。考虑到系统S,我们要问:在多大程度上,一组代理人的共同知识会影响关于系统状态的个人结论?为了解释我在这里的意思,我们首先讨论一个众所周知的谜语。C.E.SHANNON(1948):通信的数学理论。贝尔系统工程66 4。我正在测试和改进。1.红白相间的帽子。想象一下下面的情况:(I)三个戴着红帽子的女孩,G,G,正在围成一个圈。(二) 他们都知道他们的帽子不是红色就是白色。(三) 每个人都能看到所有帽子的颜色,除了她自己的。现在老师来宣布:(1)至少有一顶红帽。(2) 我会慢慢数数。一旦有人知道她帽子的颜色,她就应该举手。会发生什么?老师提供的信息是否超出了IRL已经掌握的常识?毕竟,每个女孩都看到两个红帽——因此知道其他女孩至少也看到一个红帽。因为(III),女孩们知道她们的帽子宇宙S处于8种可能的颜色分布状态之一:∑∑∑∑∑∑∑∑∑∑∑∑GR R W W W W WGR W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W W。他们共同知识的熵是:H=log8=3。教师的声明h However排除了状态σ,并将熵降低到h=log7<h,这意味着教师提供了适当的额外信息。在老师的第一次计数中,没有一个女孩能确定自己的帽子,因为没有人看到两顶白色的帽子。所以没有举手,我排除了统计σ,σ和σ的可能性。现在用π(σ)表示,当hat分布实际上是σ时,π认为可能的状态集。

58
可人4 在职认证  发表于 2022-4-24 19:27:45
我们有,例如,P(σ)={σ},P(σ)={σ},P(σ)={σ}。因此,在每种状态σ、σ、σ中,至少有一个女孩会在第二次计数时举手,并断定她的帽子是红色的,这将向其他女孩发出状态(以及帽子分布)的信号。5.如果在第二个国家没有举手,所有的女孩都知道自己处于σ状态,并会在第三个国家举手。共同知识67的对比,考虑极端的场景和假设:(i’)三克ILLS,G,Gand G,与白色帽子坐在一个圆。(二) 他们都知道他们的帽子不是红色就是白色。(三) 每个人都能看到所有帽子的颜色,除了她自己的。老师宣布的效果完全不同:o每个女孩都会立即断定自己的帽子是红色的,并举起手,因为她只看到其他女孩身上的白色帽子。该分析表明:(i)老师提供的信息是主观的:即使信息(“至少有一顶红帽”)是虚假的,女孩们最终会确信她们知道自己帽子的颜色。(ii)当一个女孩认为她知道自己帽子的颜色时,她可能得出了一个事实上错误的结论。例4.9。假设三个女孩身上任意分布着红白相间的帽子。然而,老师的声明会让女孩相信他们知道自己帽子的颜色吗?6.2. 信息和知识功能。系统中的事件是E的子集 美国的许多州。我们说E发生在S处于σ状态时∈ E.表示所有可能事件的集合,我们认为是函数P:S→ 具有σ性质的2s∈ P(σ)表示所有σ∈ Sas是一种信息功能。

59
何人来此 在职认证  发表于 2022-4-24 19:27:51
P的解释是:o如果S处于σ状态,则P提供事件P(σ)发生的信息。注意P不一定是尖锐的:任何状态τ∈ P(σ)是信息函数P下真实状态的候选者。信息函数P定义了知识函数K:2S→ 2siak(E)={σ| P(σ) E} 对于积分:oK(E)是状态σ的集合∈ 其中P表示事件确实发生了。68 4. 测试和改进引理4.2。信息函数P的知识K有七个性质:(K.1)K(S)=S(K.2)e F==> K(E) K(F)。(K.3)K(E)∩ F)=K(E)∩ K(F)。(K.4)K(E) E.证据。简单的练习,留给读者。属性(K.4)是所谓的可靠性公理:如果一个人知道(在K下)E已经发生,那么E真的发生了。例4.10(透明度)。验证所有事件E的透明度公理(K.5)K(K(E)=K(E)。解释:当一个人确信E已经发生,那么一个人确信他认为E已经发生。我们说,如果E=K(E)为真,E是明显的,这意味着:o知识函数K认为一个明显的事件E已经发生,当且仅当E真的发生了。例4.11。展示:所有可能状态的集合总是一个明显的事件。例4.12(智慧)。验证所有事件E的智慧公理(K.6)S\\K(E)=K(S\\E)。解释:当一个人不确定地知道E已经发生,那么他就知道自己的不确定性。6.3. 共同的知识。现在考虑np={p,…,pn}的nPipe PIN与各自的信息函数PI。我们说事件 如果E对N的每个成员都是明显的,那么S对N是明显的,即ifE=K(E)=Kn(E)。

60
能者818 在职认证  发表于 2022-4-24 19:27:57
常识69更一般地说,事件E 如果有一个事件F,则S被认为是状态σ中N的公知 E使得f对于N和σ是明显的∈ F.建议4.1。如果事件 S是当时玩家的常识,信息函数为π,然后为σ∈ Ki(Ki(…(Kim(E))…)适用于所有序列i。imof指数1≤ ij≤ n、 证据。如果事件E是公知的,则它包含明显的事件F E与σ∈ F从定义上讲,我们有∈ 基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基根据知识函数(引理4.2)的性质(K.2),我们由此得出(Ki(…(Kim(E))…) 基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基基F σ.作为命题4.1的说明,考虑EngSK(E)、K(K(E))、K(k(k(e)))。K(E)是所有的状态,在这些状态下,玩家pis确信E h已经发生。集合K(K(E))包括玩家pis确定playerp(E)确定E已经发生的那些状态。在K(K(K(E))中,是所有的状态,玩家pis确信玩家pis确信玩家P相信E已经发生。等等6.4. 不同的意见。L et和pbe两个具有通知功能的参与者,并假设:两个参与者对事件E的发生具有相同的概率估计Pr(E) 我们转向这个问题:o在某种状态下,这两个参与者之间是否有共同的知识*他们对事件发生的可能性的估计是否不同?令人惊讶的是(?),答案可以是“是”,如例4.13所示。对于本例中的分析,回想一下事件A的条件概率是70 4。测试和改进(E | A)=Pr(E)∩ A) /Pr(A)如果Pr(A)>00如果Pr(A)=0。例4。1 3.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-5 23:42