楼主: mingdashike22
1126 49

[量化金融] 应对动态定价竞争中的维度诅咒: [推广有奖]

21
kedemingshi 在职认证  发表于 2022-6-10 16:43:14
我们通过阶跃函数(pt,t=0,h,2h,…)来实现竞争对手随时间的价格轨迹。。。,T- h、 5.1.1。推导上界:评估前瞻性策略在寻找上界时,在本小节中,我们考虑子周期(t,t+h),t=0,h,2h,…,的真实概率P(h)t(i,a,~ P)。。。,T- h、 如果允许在时间t=0,h,…,的所有点进行价格调整。。。,T- h、 最佳前瞻性(OFL)定价政策由aOF L(h)t(n;~ pt)表示,它利用了完美的价格预期,由arg max,t=0,h。。。,T- h、 n=1。。。,N、 VOF L(h)T(N;~ pT):=0,VOF L(h)T(N;~ pT)=最大值∈A.xi≥0P(h)t(i,a,~ pt)·(a)- c) ·最小值(n,i)- n·l·h+δh·VOF l(h)t+h(n)- i) +~pt+h.(9) 接下来,我们考虑上述预测策略的第二个版本,它调整价格的频率较低。仅允许在t=0、1、…、。。。,T- 1而不是t=0,h。。。,T- h、 为了仍然能够使用草书计算(反向归纳),我们使用-将我们最新的价格存储在扩展的状态空间中。L(1)t(n,a)的最优(前瞻性)定价策略-; ~pt)由参数maxof确定,t=0,h。。。,T- h、 a-∈ A、 VOF L(1)T(n,A-; ~pT):=0,VOF L(1)t(n,a-; ~pt)=最大值∈A,t=0∨ t模1=0{a-} , 其他的xi≥0P(h)t(i,a,~ pt)·(a)- c) ·最小值(n,i)- n·l·h+δh·VOF l(1)t+h(n)- i) +,a~pt+h. (10) 注意,(10)中的作用空间与时间相关,并保证价格调整仅在t=0,1。。。,T- 1而在所有其他时间,固定的先前价格a-已使用。在(10)中,还使用了价格预期。此外,使用建议以最小单位ε(cf)打折竞争对手价格的属性。

22
mingdashike22 在职认证  发表于 2022-6-10 16:43:18
备注4.2(ii),我们可以显著加快(10)的计算速度:(i)我们使用较小的动作集来代替A:=Sk=1,。。。,Ktn(p(k)t- ε) +o,ε>0,t=0,1。。。,T- 1和(ii)我们通过只考虑-∈ A(-)t: =▄Ab(t-h) +c,对于所有时间点t,t=0,h。。。,T,其中b·c是FLOOR运算符。5.1.2. 非预期启发式的评估下一步,我们将展示如何分析评估第3节中描述的非预期策略,参见算法3.1。首先,我们只允许在t=0,1,…,时调整价格。。。,T- 1、对应的神经策略,参见算法3.1。,用aH(1)表示。我们考虑周期(t,t+1),t=0,1,…,的给定(条件)概率▄P(1)t(i,a▄~P)。。。,T- 价格aH(1)(n,~ pt)由arg maxof,t=0,h。。。,T,n=0,1。。。,N,VH(1)T(N;~ pT):=0,VH(1)T(N;~ pT)=最大值∈A.xi≥0P(1)t(i,a | ~ pt)·(a)- c) ·最小值(n,i)- n·l+δ·VH(1)t+1(n)- i) +~pt公司. (11) 注:(11)定义时间t的单一价格aH(1)t(n,~ pt),t=0,1。。。,T- 1,这取决于当前的市场状况~ pta和当前的库存水平n:=Xt。该非预期启发式(NAH)策略的预期收益aH(1)可以通过t=0,h,…,进行分析评估。。。,T,n=0,1。。。,N,VNAH(1)T(N;~ pT):=0,VNAH(1)T(N;~ pT)=最大值∈naH(1)btc(n,~ pbtc)oxi≥0P(h)t(i,a,~ pt)·(a)- c) ·最小值(n,i)- n·l·h+δh·VNAH(1)t+h(n)- i) +~pt+h.(12) 递归(12)是对启发式价格aH(1)t(n,~ pt),t=0,1。。。,T-1,应用于所有子周期t=0,h。。。,T使用公式aH(1)btc(n,~ pbtc)和正确概率P(h)T(i,a,~ pt)。

23
mingdashike22 在职认证  发表于 2022-6-10 16:43:21
注意,在(12)中,没有使用最大化,因为在每种状态下,最大运算符仅评估价格a=aH(1)btc(n,~ pbtc),其由(11)唯一确定。接下来,我们还考虑上述启发式的第二个版本,它更频繁地调整价格。允许启发式,参见算法3.1。,调整价格时,t=0,h。。。,T- h、 我们通过arg max,t=0,h,…,定义相应的保单ah(h)t(n,~ pt)。。。,T,n=0,1。。。,N、 VH(h)T(N;~ pT):=0,VH(h)T(N;~ pT)=最大值∈naH(h)t(n,~ pt)oxi≥0P(h)t(i,apt)·(a)- c) ·最小值(n,i)- n·l·h+δh·VH(h)t+h(n)- i) +~pt公司.(13) 这是(11)的推广,使用长度为1的周期,并使用▄P(h)t(i,a | ~pt)代替▄P(1)t(i,a | ~pt)。对第二个快速调整的非预期启发式aH(h)进行评估,得出预期结果,t=0,h。。。,T,VNAH(h)T(n;~ pT):=0,VNAH(h)T(n;~ pT)=最大值∈naH(h)t(n,~ pt)oxi≥0P(h)t(i,a,~ pt)·(a)- c) ·最小值(n,i)- n·l·h+δh·VNAH(h)t+h(n)- i) +~pt+h.(14)5.1.3. 通过比较战略调整频率和信息结构,我们得出了前瞻性战略的预期绩效之间的关系,参见(9),(10),以及非预期启发式之间的关系,参见(12),(14)。引理5.1。对于任何给定的价格轨迹情形~pt,t=0,h。。。,T,对于所有n=1。。。,N,t=0,h。。。,T- h、 a-∈ A、 我们有(i)VOF L(h)t(n)≥ VOF L(1)t(n,a-) ≥ VNAH(1)t(n),(ii)VOF L(h)t(n)≥ VNAH(h)t(n,a-) ≥ VNAH(1)t(n)。证据由于(9)中的价格可以在与(10)相比的其他时间点进行调整,因此(i)中的第一个不平等保持不变。(i)中的第二个不等式成立,因为(10)中的可容许价格集包括(12)中的那些。断言(ii)来自类似的论点。最后,我们量化了我们的启发式策略的性能,并与推导的上界进行了比较。示例5.1。

24
nandehutu2022 在职认证  发表于 2022-6-10 16:43:24
考虑示例4.3(i)-(iii)的设置,T=100,c=3,δ=0.9995,N=10,d=10,l=0.01,参见图4a、4b和4c。现在,使用~p:=U(5,15)随机化初始竞争对手的价格。单个企业k调整其价格p(k)tat t=0,h,…,的概率。。。,T- h、 用π表示∈ (0, 1).我们使用三组随机价格调整(k=1,…)模拟价格轨迹。。。,K、 K=10,t=0,h。。。,T- h、 h=0.1,不同调整概率π=0.01、0.03、0.1、0.3:(i)无价格趋势:p(k)t+h=最大c+0.01,p(k)t+1{U(0,1)<π}·U(-20,20)·h/π/T(ii)正向价格趋势:p(k)t+h=最大值c+0.01,p(k)t+1{U(0,1)<π}·U(-15,25)·h/π/T(iii)价格负趋势:p(k)t+h=最大值c+0.01,p(k)t+1{U(0,1)<π}·U(-25,15)·h/π/T在例5.1的三种设置中,我们采用了以下五种不同的策略,参见(9)-(14):(A)频繁通知:t=0,h。。。,T- h、 完全预期,参见VOF L(h)(B)放松通知:调整t=0,1。。。,T- 1,完全预期,参见VOF L(1)(C)频繁启发式:调整t=0,h。。。,T- h、 无预期,参见VNAH(h)(D)放松启发式:调整t=0,1。。。,T- 1,无预期,参见VNAH(1)(E)最优固定价格:仅在t=0时调整,完全预期我们使用P(h)t(i,a,~ P):=P ois(h·d·P(a,~ P))和~ P()t(i,a | ~p):=p ois( · d·P(a,~ P), ∈ {h,1}。表1总结了在实施例5.1的三种设置(i)(iii)中应用的不同策略(A)-(E)的性能比较。对于不同竞争对手的价格调整频率π,该表包含各种随机情景下基准策略A的预期利润V(A)(N;~ p)的平均值。预期利润V(A)(N;~ p)代表一个上限,因为使用了未来价格的全部信息,价格调整的可能性最大。

25
nandehutu2022 在职认证  发表于 2022-6-10 16:43:28
表中的其余列包含策略(B)-(E)与策略(A)的预期收益的平均比率。对于每个模拟的竞争场景,对所有五种策略的预期收益进行了分析评估。对于每个设置(i)-(iii)1000个轨迹场景~pt,t=0,h。。。,T- h、 进行了评估~ptπV(A)(N;~ p)V(B)(N;~ p)V(A)(N;~ p)V(C)(N;~ p)V(A)(N;~ p)V(D)(N;~ p)V(A)(N;~ p)V(E)(N;~ p)V(A)(N;~ p)(i)0.01 22.53 0.983 0.986 0.964 0.706(i)0.03 25.31 0.973 0.985 0.953 0.760(i)0.10 26.73 0.948 0.988 7 0.926 0.802(i)0.30 26.87 0.911 0.990 0.884 0.836(ii)0.01 36.11 0.990 0.964 0.954 0.781(ii)0.03 41.50 0.983 0.943 0.930 0 0.786(ii)0.10 43.96 0.968 0.932 0.910 0.780(ii)0.30 45.08 0.953 0.926 0.8980.772(iii)0.01 10.83 0.959 0.976 0.920 0.345(iii)0.03 12.04 0.930 0.984 0.891 0.440(iii)0.10 12.51 0.844 0.986 0.793 0.469(iii)0.30 12.37 0.686 0.984 0.629 0.474表1:启发式策略与模拟竞争情景(i)-(iii)上限相比的预期收益,T=100,N=10,d=10,h=0.1,和π=0.01、0.03、0.1、0.3;示例5.1。放松启发式策略(D)产生63-96%的最优结果;频繁启发式策略(C)甚至可以达到93-99%。策略(B)和(C)的性能介于策略(A)和(D)之间,参见引理5.1。我们观察到,市场波动越大,调整频率就越重要。我们的例子表明,频繁启发式策略(C)甚至可以击败松弛的知情策略(B)。虽然未来的价格是完全已知的,但最优定价策略(E)只能产生35-84%的最优利润。

26
nandehutu2022 在职认证  发表于 2022-6-10 16:43:33
附录中给出了表1的方框图,见图A.10。请注意,虽然在示例5.1中P(h)和P(h)t包含(在实际应用中可以针对小间隔h进行调整),但(11)中使用的概率P(1)可能大大超过或低估了示例5.1(i)-(iii)特定设置中的正确条件概率。因此,策略(D)的结果甚至可以通过准确估计P(1)来改善。在进一步的模拟中,我们还改变了其他参数,如时间范围T、初始项目N、竞争者数量K,以及需求参数β或竞争者的调整动态。总的来说,结果是相似的。我们在下面的备注中总结了最重要的发现。备注5.1。(调整频率和价格预期的影响)(i)一般而言,调整频率和价格预期会显著提高收益。(ii)更高的调整频率,参见启发式(C),可以过度补偿价格预期的价值,参见策略(B)。(iii)即使是经过优化选择并考虑了完美的价格预期,FIX价格策略的绩效也很低。(iv)如果市场价格有积极的趋势,参考情景(ii),那么价格预测比频繁的价格调整更重要。(v) 如果市场价格有负面趋势,请参考情景(iii),那么频繁的价格调整比价格预期更重要。(vi)如果价格经常调整,那么价格预测就不那么重要了。(vii)如果市场波动较大,则必须经常调整价格。5.2. 战略性双寡头竞争中的启发式与最优响应策略在本小节中,我们考虑战略性竞争对手,他们根据我们当前的价格选择自己的价格。目的是将我们的启发式方法与最优响应策略进行比较。

27
nandehutu2022 在职认证  发表于 2022-6-10 16:43:36
由于无法计算复杂竞争环境下的最优响应类别(由于维度诅咒),我们考虑双寡头竞争环境。5.2.1. 双寡头垄断中的最优响应策略我们想将第3节中推导的启发式策略的性能与上界进行比较,上界由利用充分信息的最优响应策略决定。我们假设竞争对手的价格反应以及反应时间都可以完全预测。注意,我们的启发式策略没有使用这些额外的信息,这些信息对应于实际场景。我们假设市场情况(状态)是一维的,并且简单地以竞争对手的价格p为特征,即我们假设s:=p。我们假设竞争对手调整其价格p以响应我们的价格a,固定延迟为 周期,0< < 1、在时间t选择价格a后,会出现竞争对手的价格反应F,这可能取决于p和a,也就是说,在大小间隔之后 竞争对手将其价格从p调整为F(a,p)。因此,我们的反应时间是1- .根据前几节的示例,在t期内,在第一个大小间隔内准确销售i件商品的概率 (第1阶段)为P()t(i,a,p):=p ois( · d·P(a,P))。在剩余时间(第2阶段),销售概率变为P(1-)t型+(i,a,F(a,p))=p ois((1- ) · d·P(a,F(a,P)))。如果已知竞争对手的策略,双寡头问题的汉密尔顿-雅可比-贝尔曼(HJB)方程可以写成,t=0,1。。。,T- 1,n=1。。。,N、 p∈ A、 0< < 1,Vt()*(n,p)=最大值∈A.xi≥0便士()t(i,a,p)·Xi≥0P(1-)t型+(i、a、F(a、p))·(a)- c) ·最小值(n,i+i)- n·l+δ·V()*t+1(n)- 我- i) +,F(a,p)o、 (15)其中V()*T(n,p)=0表示所有n,p。

28
能者818 在职认证  发表于 2022-6-10 16:43:41
相关的最优定价策略a()*t(n,p),t=0,1。。。,T- 1,n=1。。。,N、 p∈ A、 由参数最大值(15)确定。5.2.2. 双寡头垄断中的启发式反应策略 众所周知,我们的启发式策略(参见算法3.1)可以使用给定的条件概率≈P(1)t(i,a | P)来应用。在t=0,1,…,时调整价格的相应策略。。。,T- 1用▄a表示()t(n,p),n=1。。。,N、 p∈ A、 由参数maxof定义,t=0,1。。。,T- 1,n=1。。。,N,p∈ A、 0< < 1,¢V()T(n,p):=0表示所有n,p,~V()t(n,p)=最大值∈A.xi≥0P(1)t(i,a | P)·(a)- c) ·最小值(n,i)- n·l+δ·¢V()t+1(n)- i) +,p. (16) 启发式策略a的性能()t、 参考(16),可以再次进行分析评估,并得出(次优)预期收益,t=0,1。。。,T- 1,n=0,1。。。,N、 p∈ A、 0< < 1,’V()T(n,p)=0,’V()t(n,p)=最大值∈{a()t(n,p)}xi≥0便士()t(i,a,p)·Xi≥0P(1-)t型+(i、a、F(a、p))·(a)- c) ·最小值(n,i+i)- n·l+δ·'V()t+1(n)- 我- i) +,F(a,p)o、 (17)注意,由于竞争对手的反应,概率P(1)t(i,a,P)和▄P(1)t(i,a | P)可能会有所不同,例如,如果竞争对手迅速降低我们的价格,我们的价格排名发生变化,参见图1a。因此,假设价格稳定,并使用▄P(1)t(i,a | P):=P(1)t(i,a,P)可能(强烈)高估条件销售概率。因此,在这种情况下,观察到的销售将表明销售概率P(1)t(i,a | P)与P(1)t(i,a,P)显著不同。一般而言,特定竞争格局的特征将反映在销售数据中。分析已实现销售额、有效价格和价格调整时观察到的潜在市场情况之间的关系,参见。

29
能者818 在职认证  发表于 2022-6-10 16:43:44
第4.1节使我们能够估计条件销售概率P(1)t(i,a | P),另请参见,例如,Vulcano et al.(2012)、Abdallah、Vulcano(2016)和Fisher et al.(2017)。请注意,无论是竞争对手的战略还是反应时间都不必被发现。精确估计▄P(1)t(i,a | P)可提供▄P(1)t(i,a | P)≈Xi,i≥0:i+i=iP()t(i,a,p)·p(1-)t型+(i,a,F(a,p))。(18)5.2.3. 在双头垄断下,我们想衡量启发式策略与最优(知情)策略的性能。下面的例子研究了一种最常见的策略,这种策略总是略微降低竞争对手的价格,参见例子4.3(iv),图4d。我们还研究了反应时间的影响 以及▄P(1)t估计的准确性。示例5.2。我们假设一个双寡头垄断,即K=1。设T=100,N=5,l=0.01,c=3,δ=0.9995,0< < 1,d=10。需求定义如例4.3所示,即P()t(i,a,p):=p ois( · d·P(a,P))。我们让我们的竞争对手使用响应策略F(a,p):=最大值(a- ε、 c),ε=1,A:={1,2,…,120}。竞争对手调整价格,单位为t=, 1 + , ..., T- 1 + . 我们将价格调整为t=0,1。。。,T- 1、我们模拟了三种不同的价格调整策略:(i)最优响应策略(i)a()*, 参见(15),(ii)启发式策略(ii)~a(), cf.(16),基于▄P(1)t(i,a▄P):=P(1)t(i,a,P)和(iii)启发式策略(iii)▄a(), 参考(16),基于(18)中定义的(精确)P(1)t(i,a | P)。图5显示了最佳响应策略,例如5.2(i)-(iii)在时间t=0时,对于不同的库存水平n和竞争对手的价格p = 0.5. 图5a说明了最佳策略;图5b和5c分别描述了案例(ii)和(iii)中的启发式策略。

30
何人来此 在职认证  发表于 2022-6-10 16:43:47
对于不同的库存水平,最优响应策略(i)具有相似的形状:如果竞争对手的价格非常低,最好将价格提高到一定的价格水平。如果竞争对手的价格很高,则必须选择几乎相同的价格水平。如果竞争对手的价格介于两者之间(中间范围),最好将价格降低一个价格单位ε。如果n增加,则价格上限降低;中档尺寸相同,但级别较低。0 20 40 60 80 100 120P102034050607070(i)a0(Δ)*(n,p)n=1n=50 20 40 60 80 100 120P102003040506070(ii)a0(Δ)(n,p)n=1n=50 20 40 60 80 100 120P1020340506070(iii)a0(Δ)(n,p)n=1n=5图5:不同库存水平的反馈价格比较n:最佳响应策略(i)a()*(n,p)(左窗口5a)和(ii)(ii)~a情况下的启发式策略()(n,p)(中间窗口5b)和案例(iii)(iii)~a()(n,p)(右窗口5c)对于n=1,2,3,5, = 0.5; 示例5.2.0 20 40 60 80 100T102034050(i)(Δ)*ptXt0 20 40 60 80 100T102034050(ii)at(Δ)ptXt0 20 40 60 80 100T102034050(iii)at(Δ)ptx图6:模拟价格路径随时间变化的比较:最优政策(i)a()*(n,p)(左窗口6a)和启发式策略(ii)(ii)~a()(n,p)(中间窗口6b)和案例(iii)(iii)~a()(n,p)(右窗口6c)对于n=5,T=100, = 0.5; 示例5.2。总体而言,启发式策略具有相似的特征。与最优响应策略和启发式(iii)相比,启发式(ii)的价格更低,中间区间更宽。案例(i)和(iii)的对应图 = 0.1和 = 0.9如附录所示,见图A.11和A.12。注意,案例(ii)的政策独立于 因为反应时间既不是显式的也不是隐式的。我们观察到最优策略的中间区间在.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 11:21