楼主: nandehutu2022
1766 75

[量化金融] 驾驶员激增定价 [推广有奖]

71
何人来此 在职认证  发表于 2022-6-23 23:43:05
我们的想法是,如果我们发现集合A、B,边际利用率相等(L(A)=L(B)>0),集合A中的收益率支配集合B(γ(A)>γ(B)中的收益率,一∈ A、 b类∈ B) ,那么我们可以用A:σ=σ替换策略中的B∪ A\\B==>R(w,σ)>R(w,σ)。奖励的分母保持不变,分子增加。根据假设和定义得出的一些事实:L(A)>0σ6=(0,∞), F({τ:γ(τ)>0}∩ σ) < 1c:L(Bc)>0 F({τ:γ(τ)>0}∩ σ) >0L(Ac)在c中不随c的增加而增加SL(Bc)在c中不随c的增加而减少LC→∞L(Ac)=0γ(τ)渐近有界于defnL(B)=0γ(τ)非负(Ac),L(Bc)在cTo中保持连续。请参见最后一个声明,请注意,L(Ac)和L(Bc)仅在F({τ:γ(τ)=c})为非零的情况下才是不连续的,即使在这种情况下也是从左侧连续的。非递增/非递减属性意味着C使L(Ac)<L(Bc),c>c。这个事实,连同左连续性和L(Ac),L(Bc)的相同不连续点,意味着c使c=最大值{c:L(Ac)≥ L(Bc)}如果L(Ac)=L(Bc),那么我们就完成了这部分:设σc=σ∪ Ac\\Bc={τ:γ(τ)≥ c} ,我们有R(w,σc)>R(w,σ)。否则,如果L(Ac)>L(Bc)(如果F({τ:γ(τ)=c})非零,则可能发生这种情况),我们需要选择{τ:γ(τ)=c}的子集,以便构造集的总体利用率保持不变。我们可以这样做:o根据c的定义,对于所有c>cwe,L(Ac)<L(Bc)。然后L(Bc)<L(Ac)<L(Bc∪ {τ : τ ∈ σ、 γ(τ)=c})o设c {τ : τ ∈ σ、 γ(τ)=c},这样L(Bc∪ C) =L(Ac)。

72
大多数88 在职认证  发表于 2022-6-23 23:43:09
这种C的存在是因为F是连续的设σc=σ∪ Ac \\(Bc∪ C) ,等于σC=σ>C∪ C对于某些C {τ:γ(τ)=c}。由于两组的利用率相同,我们现在有R(w,|σc)>R(w,σ),并且每个tripin|σCI在单位时间内的价值至少与σ中相应的trip相同。第2步。对于任何形式为▄σc=σ>c的▄σcof∪ c对于某些c∈ R+,C {τ:γ(τ)=c},至少以下各项为真:R(w,σ>c)≥ R(w,σc)或R(w,σ≥c)≥ R(w,|σc)。设C={τ∈ {τ : τ ∈ σ、 γ(τ)=c}\\c},即一组跳闸,使得γ(τ)=cbut不在c中。我们通过与边缘值阈值c相比,推断R(w,∑c)的值来证明这一步骤。o假设c≥ R(w,|σc)。然后,我们可以将行程添加到集合:R(w,{τ:γ(τ))≥ c} )=λRτ∈σcw(τ)dF(τ)+λRτ∈Cw(τ)dF(τ)1+λRτ∈σcτdF(τ)+λRτ∈CτdF(τ)≥ R(w,|σc)(3),其中不等式来自R(w,|σc)=λRτ∈σcw(τ)dF(τ)1+λRτ∈σcτdF(τ),λRτ∈Cw(τ)dF(τ)λRτ∈CτdF(τ)=λRτ∈Cw(τ)ττdF(τ)λRτ∈CτdF(τ)=C,和xz≥怀俄明州==>w+xy+z≥wy.o或者,假设c<R(w,∑c)。然后,我们可以从集合中移除跳闸:R(w,{τ:γ(τ)>c})=λRτ∈σcw(τ)dF(τ)- λRτ∈Cw(τ)dF(τ)1+λRτ∈σcτdF(τ)- λRτ∈CτdF(τ)>R(w,|σC)(4),其中不等式遵循wy>xz==>w-xy型-z> wywhen w- x个≥ 0,y- z≥ 0、步骤3。c*对于所有c:R(w,σ≥c*) ≥ 最大值(R(w,σ≥c) ,R(w,σ>c))在第一个子部分中,我们只需要证明存在一个最大化子c*对于函数max(R(w,σ≥c) ,R(w,σ>c)):这一事实不是立即发生的,因为σ是有限集。以下是正确的o假设w(τ)/τ是渐近有界的,我们得到的回报是有界的:存在R,因此对于所有σ,我们有R(w,σ)∈ [0,\'R]。oF是连续分布,所以limc→∞F({τ:γ(τ))≥ c} )=0。

73
何人来此 在职认证  发表于 2022-6-23 23:43:12
存在这样的情况c>c:R(w,σ>c)<R((0,∞)), R(w,σ≥c) <R((0,∞))o R(w,σ>c)在c中从右起连续,R(w,σ≥c) 在c中从左边开始是连续的,这两个函数具有相同的不连续点:c使得F({τ:γ(τ)=c})>0(这些也是它们唯一的不一致点)。要了解这些事实,请观察F(σ>c)和F(σ≥c) 分别具有相同的属性。因此,函数max(R(w,σ≥c) c的R(w,σ>c))在某些c下达到最大值*∈ [0,C]。换句话说,存在c*因此c、 最大值(R(w,σ≥c*), R(w,σ>c*)) ≥ 最大值(R(w,σ≥c) ,R(w,σ>c))。在第二个子部分中,我们通过证明R(w,σ≥c*) ≥ R(w,σ>c*), i、 例如,我们可以在保险单的每一时间价值的边际上包含折扣假设c*≥ R(w,σ>c)*). 然后,通过与第(3)行相同的参数,R(w,σ≥c*) ≥ R(w,σ>c*),包括边际旅行会增加回报。o假设c*< R(w,σ>c*).– 如果B:c*< B使得质量F({τ:γ(τ))∈ (c)*, B] })=0,然后注意σ>c*等于σ≥Bup到一组度量值0,因此R(w,σ>c*) = R(w,σ≥B) .–否则,让B:c*< B<R(w,σ>c*), 注意F({τ:γ(τ))∈ (c)*, B] })>0。然后,通过与第(4)行相同的参数,R(w,σ>c*) < R(w,σ>B)≤ 最大值(R(w,σ≥c*), R(w,σ>c*)) =R(w,σ≥c*): 我们可以删除子集(c*, B) 从政策σ>c*提高奖励,等等σ≥c*必须是最优的。因此存在c*, 对于所有σ,我们有R(w,σ≥c*) ≥ R(w,σ)。C、 3命题3.1的证明在单一状态下,如果0,则w(τ)=mτ+a是激励相容的≤ 一≤mλ。证据证据设T=Rτ∈(0,∞)τdF(τ)。

74
能者818 在职认证  发表于 2022-6-23 23:43:15
设σ=(0,∞) \\ σ、 对于某些σ。R((0,∞)) =λRτ∈(0,∞)w(τ)dF(τ)1+λTR(σ)=λRτ∈(0,∞)w(τ)dF(τ)- λRτ∈σw(τ)dF(τ)1+λT- λRτ∈στdF(τ)==> R((0,∞)) ≥ R(σ)<==>λRτ∈(0,∞)w(τ)dF(τ)1+λT≤Rτ∈σw(τ)dF(τ)Rτ∈στdF(τ)最后一行从wy开始≥w-xy型-z<==>怀俄明州≤xz。因此,激励相容性的一个必要且有效的条件是λRτ∈(0,∞)w(τ)dF(τ)1+λT≤Rτ∈σw(τ)dF(τ)Rτ∈στdF(τ)σ.假设w(τ)=mτ+a。然后,对于0≤ 一≤mλ:λRτ∈(0,∞)w(τ)dF(τ)1+λT=λ(mT+a)1+λT≤m(λT+1)1+λT=m a≤mλ≤ m+a“F(σ)Rτ∈στdF(τ)#σa≥ 0(5)=Rτ∈σw(τ)dF(τ)Rτ∈στdF(τ)注意,该条件是有效的,但不是必要的。证明必要条件需要在假设分布F的情况下拧紧线(5)。C、 4单状态模型最优策略的唯一性4。考虑单状态模型。存在最优策略σ*σ形式的*={τ:w(τ)τ≥ c*} 使得R(σ*) = c*. 此外,该策略是唯一的最优策略,最多可设置度量值0,最多可修改(减法)集合{τ:w(τ)τ=c*}.证据证据根据定理1,存在σ形式的最优策略*= {τ:w(τ)τ≥ c*},对于一些c*. 这里,我们证明(1)存在一个最优策略σ*其形式为R(σ*) = c*, (2)这是唯一的最优策略,在度量值为0的集合和{τ:w(τ)τ=c的集合的修改(减法)之前*}.1、从任何最优策略σ开始*σ形式的*= {τ:w(τ)τ≥ c} ,对于某些c和letc*= R(σ*) 成为最佳奖励。那么,σ≥c*= σ*至多组度量值0,其中σ≥c*= {τ:w(τ)τ≥ c*}. 如果是c*= c、 这是微不足道的。否则,假设R(σ*) = c*> c、 然后,注意σ≥c* σ*. 如果F(σ*\\ σ≥c*) > 0:R(σ≥c*) =λRτ∈σ*w(τ)dF(τ)- λRτ∈σ*\\σ≥c*w(τ)dF(τ)1+λRτ∈σ*τdF(τ)- λRτ∈σ*\\σ≥c*τdF(τ)>R(σ*)由λRτ得出∈σ*\\σ≥c*w(τ)dF(τ)λRτ∈σ*\\σ≥c*τdF(τ)<c*= R(σ*) =λRτ∈σ*w(τ)dF(τ)1+λRτ∈σ*τdF(τ),and xz<wy==>w-xy型-z> wywhen w- x个≥ 0,y- z≥ 0

75
kedemingshi 在职认证  发表于 2022-6-23 23:43:18
这与σ相矛盾*是最佳的。类似地,假设R(σ*) = c*< c、 然后,注意σ* σ≥c*. 如果F(σ≥c*\\ σ*) > 0:R(σ≥c*) =λRτ∈σ*w(τ)dF(τ)+λRτ∈σ≥c*\\σ*w(τ)dF(τ)1+λRτ∈σ*τdF(τ)+λRτ∈σ≥c*\\σ*τdF(τ)>R(σ*)由λRτ得出∈σ≥c*\\σ*w(τ)dF(τ)λRτ∈σ≥c*\\σ*τdF(τ)>c*= R(σ*) =λRτ∈σ*w(τ)dF(τ)1+λRτ∈σ*τdF(τ),and xz>wy==>w+xy+z>wy。这与σ相矛盾*是最佳的。2、以上第一部分证明了σ形式的政策的唯一性≥c={τ:w(τ)τ≥ c} 定理1证明的步骤1进一步表明,只有形式为▄σc=σ的策略≥c\\c对于某些c∈ R+,C {τ:γ(τ)=c}可以是最优的。与上述和定理1证明步骤2几乎相同的参数将完成证明。动力学模型结果的D证明在本节中,我们提供了关于动力学模型的主要文本中的定理和引理的证明。第D.1节包含关于Driverward的动态模型引理的证明以及在每个状态下花费的时间,引理1、2和3。第D.2节概述了定理2和3的证明策略,特别是包含了用于证明这两个定理的主要技术引理。第D.3节包含用于证明主要结果的几个辅助引理的陈述。这些引理的证明推迟到第D.5节,因为它们在代数上很乏味。最后,第D.4节包含了我们的主要结果定理2和3的证明。D、 1驾驶员报酬引理2。假设世界在时间t处于状态i。让qi→j(s)表示世界在时间t+s时处于状态j 6=i的概率。然后,qi→j(s)=λi→jλi→j+λj→ih1- e-(λi→j+λj→i) 啜饮。证据考虑到模型中的状态动力学,qi→j(s)由aCTMC在时间s内的演变决定,假设当前状态为i。我们可以在这里使用标准CTMC结果。LetQ表示世界状态CTMC的Q矩阵。

76
大多数88 在职认证  发表于 2022-6-23 23:43:21
根据模型定义,Q=-λ1→2λ1→2λ2→1.-λ2→1.回想一下,时间t后的状态转移矩阵由矩阵指数eQt给出,它等于Q:qi预解的逆的拉普拉斯变换的逆→j(τ)=(eQτ)ij=L-1((wI- Q)-1ij)(τ)w是拉普拉斯变换参数=λi→jλi→j+λj→ih1- e-(λi→j+λj→i) τi由于2状态模型假设,最后一行中的闭合形式出现。接下来,引理1和引理3一起被证明。引理1。在动态模型中,收益率可以分解为每个状态i的收益率Ri(wi,σi)和状态i花费的时间ui(σ)的分数:R(w,σ)=u(σ)R(w,σ)+u(σ)R(w,σ),概率为1。在单态模型中,Ri(wi,σi)=wi(σi)Ti(σi),其中wi(σi)=Fi(σi)Zτ∈σiwi(τ)dFi(τ),Ti(σi)=λiFi(σi)+Fi(σi)Zτ∈σiτdFi(τ)引理3。设Ti(σi)如引理1所定义。遵循策略σ={σ,σ}的驾驶员在状态i打开或在状态i开始的行程中花费的时间分数为ui(σ)=λiFi(σi)Ti(σi)Qj(σj)λjFj(σj)Tj(σj)Qi(σi)+λiFi(σi)Ti(σi)Qj(σj),其中Qi(σi)=λi→j+λiZτ∈σiqi→j(τ)dFi(τ)证明。证据考虑正文中定义的更新过程(包括周期和子周期)。单个奖励更新周期为:从驱动程序在状态1中打开到驱动程序在状态2中至少打开一次后,下一次在状态1中打开之间的时间。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-5-1 03:06