楼主: nandehutu2022
2138 60

[量化金融] 随机切换博弈 [推广有奖]

31
能者818 在职认证  发表于 2022-6-10 06:41:12
这当然给特权球员带来了最终的优势,他们将最终“赢得”比赛。例如,在运行示例中,取(M,N,N)=(0,4,2)意味着P2只有2个开关,而P1有4个开关,因此她最终将成功驾驶到可能的最佳状态限制→∞Mt=+2,任何时候都不会需要超过4个开关(回想一下M=+2)。因此,这个设置类似于第4.1节讨论的辅助游戏,只是两个玩家现在都在动态优化他们的阈值。5案例研究:均值回复市场优势继续实施例2.1,我们通过OrnsteinUhlenbeck(OU)过程描述当地市场波动(Xt),均值回复θ=0:dXt=-uXtdt+σdWt,(36),其中u=0.15,σ=1.5,D=R(即自然边界D=-∞ 和d=+∞). 这表明X的平稳分布为高斯分布,N(0,7.5)。对于折扣率,我们取10%。表1中列出的利润率πi为常数和d。注意,πi是单调的,但在制度m方面是凹的。一个激励性的经济环境是两家公司之间的广告竞争。他们可以通过支付Ki来制作广告,费用取决于汇率(Xt)。广告的效果(即在M中进行改变)是增强ce one公司在市场上的主导地位,为其带来更高的利润。由于规模收益递减,随着企业占据越来越多的市场份额,利润率的提高也会下降,因此πimis在m中呈凹形。在表1中,我们的目的是利润阶梯永远向右和向左延伸,但上述凹形使得达到极端的优势水平是不经济的。因此,我们逐步扩大了所考虑的市场制度的数量:Mt∈ {-1,0,1}(案例一),Mt∈ {-2.-1、0、1、2}(案例II)和Mt∈ {-3.3} (案例三)。

32
可人4 在职认证  发表于 2022-6-10 06:41:15
下面我们还考虑了Mt的不对称情况∈ {-1, 0, 1, 2}.切换成本Ki受Xt:Kim(x):=ci·(1+e)影响(-1) iβix),i∈ {1,2},(37),其中ci=0.5,βi=0.5,i∈ {1, 2}. 因此,当x>> 0和玩家2在x<< 0.对于简化,Ki\'s不受(Mt)的直接影响。通过构造,收益率和所有其他参数都是对称的(大约为零),因此在平衡状态下,我们期望玩家在X函数从正变为负时对称行动,反之亦然。与此案例相关的最佳反应归纳研究y,M={-1,0,1}是图2所示,并在第4.1节中进行了解释。我们还实现了平衡诱导-3.-2.-1 0+1+2+3πm0.0 1.5 2.8 4.0 5.1 5.9 6.0πm6.0 5.9 5.1 4.0 2.8 1.5 0.0表1:第5节的利润率阶梯πim。(参见第4.2节)对于第一和第二种情况以及ob发球,当球员在最终控制场景中比对手拥有更多控制时,他们会表现出攻击性。如图4所示,玩家2将拥有“最后一句话”和限制→∞M*t=-因此,她可以表现得更积极,更频繁地成为领导者,并在中期内获得更高的回报。5.1平衡阈值稳定2列出了三种情况下计算的平衡阈值。回想一下,如果IM被限制在{-1,0,1},因此当Mt=+1(Mt=-1),当没有s1时,*或s2,*-因此,需要计算4个总阈值,系统中有12个方程(44)。由于对称参数的设置,玩家1的阈值与玩家2的阈值在0左右对称,原则上,平衡的特征是s1对,*, s1,*-1.

33
nandehutu2022 在职认证  发表于 2022-6-10 06:41:18
类似地,在案例II中有8个阈值(4个唯一的阈值)和24个方程,在案例III中有12个阈值和36个方程。一个主要的发现是,在所有情况下,玩家在每个内部区域执行相同的阈值。例如,s1,*= 在所有三种情况下均为0.94681 I/II/III。因此,当处于状态时-20-10 0 10 20 30 401020030405060X游戏值SD-21天-11D01D+11D+21案例II案例I(a)参与者1的均衡支付V(x)-1.5-1-0.5 0.0 0.5 1.0 1.5303234363840X游戏值S02,*s01,*(b)放大V(x)视图图5:案例I和案例II中玩家1的均衡支付V(x)。左面板:虚线表示Dm;D±1是案例I中VMS的渐近线,D±2是案例II中VMS的渐近线。该框表示与放大的右侧面板相对应的区域。右:虚线表示引线V+1(x)- K(x)和跟随者payoff s V-每种情况1(x)。相同的结果阈值si,*, 我∈ 在这两种情况下都采用{1,2}。制度πmπmCase I案例II案例II第1层玩家2玩家1玩家2玩家1玩家2+3 6.0 0.0- 3.47853+2 5.9 1.5 - 0.25184 13.16216 0.25184+1 5.1 2.8 - -0.56688 1.90352 -0.56688 1.90352 -0.566884.0 4.0 0.94861 -0.94861 0.94861 -0.94861 0.94861 -0.94861-12.8 5.1 0.56688 - 0.56688-1.90352 0.56688 -1.90352-2 1.5 5.9 -0.25184- -0.25184-13.16216-3 0.0 6.0 -3.47853-表2:平衡阈值si,*M对于第5.0节中的案例I、II和III,参与者1“看不到”是否可以达到阶段+2,并且仅根据πI±1做出决策。这种现象在以下两个方面是不直观的。一方面,玩家1具有相同的平衡阈值s1,*= 0.94861,尽管在第二和第三种情况下,她可以进一步进行转换,以增强她在+1状态下的主导地位。后一种情况预计会使从0到+1的转换更有价值,从而使P1在0状态下更具侵略性。

34
mingdashike22 在职认证  发表于 2022-6-10 06:41:21
正如我们所看到的,这种直觉虽然在单一主体环境中有效,但在构建的平衡中却失败了。另一方面,玩家也对来自其他玩家开关的多步威胁目光短浅。例如,P2实现相同的阈值s2,*+1= -0.56688,但在第二和第三种情况下,她面临的威胁是,P1可能会将市场转向更加不利的制度。图5(a)绘制了参与者1 x 7的均衡收益-→ V(x)(构造为(21)),当情况I和II的强度M=0时。正如所料,Vm是连续的、递增的和有界的:V1,(I)以D为界-1和D+1,而V1,(II)以D为界-2和D+2。请注意,当这些参与者在局部实力相等时(即X=0),在案例II中,参与者1的回报率较低,这可以解释为他们之间更激烈竞争的影响。图5(b)的右面板说明了Vm变分不等式的性质。虚线表示引线V+1(x)-K从切换(Mt)到(+1)和以下PAYO FF V-1(x)。我们得到V(x)与V重合-1(x)表示x<s2,*m(P2的停止区域),并平滑粘贴到V+1(x)- K(x)在切换阈值s1处,*P1的。如前所述,即使所有游戏支付(特别是Vand V±1)发生变化,这种切换阈值在案例I和II中也是相同的。5.2均衡的宏观市场结构由于(36)中O U过程的均值回复特性,得出的M*是经常性的。特别是,在极端情况下,保证M向零移动。表3显示了时间M的长期比例*每个制度的支出,ρm除以(24)。该表还列出了扩展跳链ˇM的转移矩阵P,以及情况I的平均逗留时间ξ,其中ˇM取{-1.-, 0-, 0+, +1+}. 注意,由于区域数量有限,M的不变分布是均匀的,即。

35
mingdashike22 在职认证  发表于 2022-6-10 06:41:23
原始跳跃链M在区域0花费s一半的时间,在区域±1花费25%的时间。当然,相应的逗留时间并不相等,因此M的长期分布*更为复杂。模式πmπmCase I案例II C ase III+3 6.0 0 0.0 0 0.00002+2 5.9 1.5 0.34476 0.34474+1 5.1 2.8 0.47186 0.12711 0.127114.0 4.0 0 0 0.05628 0.05628-12.8 5.1 0.47186 0.12711 0.12711-2 1.5 5.9 0.34476 0.34474-3 0.0 6.0 0.00002P=(-1)-(0)+(0)-(+1)+(-1)-0 1 0 0(0)+0.205 0 0 0.795(0)-0.795 0 0 0.205(+1)+0 0 1 0,~ξ =(-1)-(0)+(0)-(+1)+ 4.431 0.264 0.264 4.431.表3:平衡平稳分布ρmof M*对于案例I、II和III。右侧:DynamicsofˇM*在案例I中,从表2中,我们观察到阈值si,*都很低,所以*不会在制度0中花费太多时间,市场通常不会处于“同等强度”。在案例I中,只有一个级别的市场优势是可能的,因此我们观察到从“同等实力”到“P1优势”或“P2优势”的快速转换,每一个都发生在ρ(I)±1=47%的时间内。在第二种情况下,因为si,*保持不变,我们有相同的ρ(II),因此市场继续被一个参与者主导(但现在不同程度),大约47%的时间。因此,案例II中制度{+1,+2}的长期分布可被视为案例I中制度+1的47%的“分裂”。此外,当一个参与者主导市场时,他将在大部分时间内最大化其主导地位(ρ(II)±2=47%中的34%)。第二个发现是,可以有效地内生化M的域M。回想一下,如果游戏阶段已经有利,则M的收益率πimin的凹度会降低玩家进行进一步转换的动机。相反,对手更有动力将M切换回0。在本例中,当从+2到+3时,我们使利润的边际收益最小(玩家2分别为-2到-3)。

36
可人4 在职认证  发表于 2022-6-10 06:41:26
因此,在案例III中,P1从+2切换到+3的动机很小,反映在非常高的平衡阈值s2中,*+2= 13.1621594. 由于该阈值远高于均值回复水平θ=0,因此,这些参与者不太可能将其优势提升到最大水平,并且±3 w的制度很少发生;根据表3,M*在这些极端政权中花费的时间不到0.001%。因此,从财务角度来看,可以简单地限制M{-2.-1,0,+1,2},因为有效ρ(III)m ρ(II)mF对于所有m.5.3利润阶梯的影响为了分离利润率πim的影响,我们构建了阈值ty pe平衡,mR限制为m(IV)={-1、0、+1、+2},并在第2阶段改变玩家1的收益率π(分配收益率仍如表1所示)。在图6中,这些参与者的最终平衡阈值由实线确定。正如所料,当π+2增加时,在制度+2中有更多的好处,因此,参与者1更愿意从+1转换。因此,她实现了较低的切换阈值和s1,*+1在π+2中减少。相反,她没有改变阈值s1,*在制度0下,确认前一节讨论的平衡阈值的近视性质。然而,最终π+2-π+1足够大(或者s1,*+1足够低)以触发同时开关(s1,*> s1,*+1) ,因此P1将直接从区域0传递到区域2(回想一下,我们假设这会导致两个切换成本,线性增加)。在后一种情况下,她很快就在注册表0中切换,参见图6(a)中的极右图,其中s1,*一旦s1开始改变,*+1<s1,*.将注意力转向播放器2,她的sw瘙痒阈值s2,*在区域0中,π+2永远不会影响0。

37
大多数88 在职认证  发表于 2022-6-10 06:41:29
此外,虽然她在制度+2中的得失率受到影响,但P1更频繁地切换到Mt=+2的更具攻击性的行为会导致她通过降低s2来做出反应,*+2、此外,在P1从0直行到+2(π+2)的情况下≥ 6.25),P2增加2,*+1,调整他的策略,以响应P1更积极的策略,该策略降低了他从+1切换到0的预期收益。这些观察结果说明了不同市场状态下阈值之间的复杂反馈效应以及潜在的πim。5.4切换成本的影响另一个重要参数是切换成本K。为了研究K的影响,我们改变了切换成本的总体水平,单位为Ki(x)=ci·(1+e(-1) iβi)。具体而言,我们尝试ci∈ [0.1,1],即相对于之前设置中使用的基线ci=0.5,从20%到200%,所有其他参数不变。对于案例I,玩家1及其在“同等强度”V(0)下的平衡阈值如图7所示,其中M={-1, 0, +1}.观察到,随着CIDECREAES(图7中从右到左),P1采用较低的阈值,而P2采用较高的对称阈值,这意味着他们更频繁地切换宏观市场环境。例如,预计停留时间M*在制度(+1)+5.9 6.0 6.1 6.2 6.3-1-0.50.00.51.01.52.0π+21s1,*S-11、*S01、*S+11、*(a)播放器15.9 6.0 6.1 6.2 6.3的阈值-1-0.50.00.51.01.52.0π+21s2,*S02,*S+12,*S+22,*(b)玩家2的阈值图6:平衡切换阈值si,*m(P1在左边,P2在右边),因为P1的π+2在情况IV中有所不同。我们对两个p面上的每个区域m使用相同的线类型。在ci=1.0时从6.522下降到ci=0.1时的1.887,而在状态(0)+下的预期停留时间从ci=1.0时的0.422下降到ci=0.1时的0.105。

38
nandehutu2022 在职认证  发表于 2022-6-10 06:41:32
假设Ki(x)是x的函数,因此降低阈值等于支付更多。虽然较低的(单一)切换成本会导致更频繁的切换,但切换的总成本会下降,因此均衡收益会随着cideclines的增加而增加。5.5多阈值类型均衡如上所述,很可能存在多阈值类型均衡。根据定理3.4,任何适用于非线性方程组的解都是切换博弈的MNE。这种情况出现在上述情况II中,并通过在第4.2节的平衡诱导过程中选择不同的局部平衡来“检测”。具体而言,在某些子阶段,局部停止博弈中存在两种不同的阈值类型均衡,这可以解释为“更快”(玩家行为更具攻击性,一旦(Xt)从零变为零,就会快速切换)和“更晚”(玩家更放松,绝对值也更大)。在[2]中,这种现象已经被记录下来用于停止游戏。然后,在平衡过程中,我们始终选择(i)以后的平衡(这是上面表2-3中所做和报告的);(ii)er平衡也是如此。这会产生两种不同的si序列,*m、 这最终产生了非线性系统的两种不同的解决方案,如表4所述。我们注意到,在前面描述的“更快”平衡中,球员有效地跳过了±1的区域作为s1,*> s1,*+1和2,*< s2,*-1、例如,s从M开始*= 0且X=0,P1在Xt=1.389=s1之前不会向上切换,*,S、 然后直接转到M*= +2由于1.389>1.029=s1,*,S+1。因此,交替平稳分布ρSofMS,*仅在上受支持{-2,0,2}(有趣的是,在积极均衡中,ρS>ρLso市场通常处于“同等强度”)。

39
kedemingshi 在职认证  发表于 2022-6-10 06:41:35
当(Xt)向其首选方向移动时,此类多个瞬时开关表示其攻击性,玩家s0.2 0.4 0.6 0.8 1.00.20.40.60.81.01.2cis1,*S-11、*S01、*(a)参与者10.2 0.4 0.6 0.8 1.037.0 37.5 38.0均衡收益的g阈值切换(b)参与者1的均衡收益图7:左:P1采用的均衡阈值在[0.1,1]中有所变化。P2的阈值是反对称的,大约为0。右图:“等强度”下的平衡支付,即V(0)=V(0),由于对称性。尝试通过切换到制度±2来提取最大优势。与之前的分析一致,短期er均衡带来较低的均衡收益,因为参与者因积极干预而受到惩罚,导致“浪费”收益,例如Vi,s(0)=33.65<Vi,L(0)=33.98。备注6。在案例I中,似乎存在一个独特的均衡,我们猜测这是由于只有一个内部机制,其中玩家同时竞争。因此,withM={-1,0,1}在任何一个有限控制诱导期间,我们总是观察到一个唯一的局部阈值型平衡。在有限控制切换博弈中,建立更精确的均衡唯一性条件仍然是一个悬而未决的问题。

40
何人来此 在职认证  发表于 2022-6-10 06:41:38
类似地,我们没有机制来检查案例II中是否存在进一步的阈值型平衡。-2.-1 0+1+2 Vi(0)侧1,*,Lm公司-0.25184 0.56688 0.95861 1.90352 -33.98s2,*,Lm公司- - 1.90352-0.94861-0.56688 0.25184ρLm0.34476 0.12711 0.05628 0.12711 0.34476Sooners1,*,Sm0.17983-0.19139 1.38933 1.02891 -33.65s2,*,sm- - 1.02891-1.38933 0.19139 -0.17983ρSm0.41143 0.17714 0.41143表4:平衡阈值si,*曼德长期分布~ρof(M*t) 与案例II6案例研究中的两个不同均衡相关:长期优势转向案例2.2,我们现在考虑当地市场波动X遵循几何下降运动(2),漂移u=0.08,波动率σ=0.25,贴现率r=10%。因为-σ> 0,极限→∞Xt=+∞ a、 因此,从长远来看,玩家1将主导市场,因为她最终将在X方面拥有优势。收益率πi为常数,由π给出-1= 0; π= 3; π+1= 5;π-1= 5; π= 3; π+1= 0.Kim的转换成本再次独立于m,由X:K(X):=(10)驱动- x) +,K(x):=(-2+x)+。(38)本案例研究可以解释为使用可再生资源的能源生产者(参与者1)和使用可耗竭资源的生产者(参与者2)之间的竞争。竞争是指发电量,mt表示相对生产能力。这里,Xt表示呼气能力的边际成本,它与呼气能力的相对成本相关。我们预计Xt→ +∞ (“峰值油”);随着不可再生资源的取消,P2变得不具竞争力。因此,从长期来看,P1将占据主导地位,但对于新产能的竞争性投资将发生多少次,没有上限。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 04:25