楼主: nandehutu2022
1747 75

[量化金融] 驾驶员激增定价 [推广有奖]

31
能者818 在职认证  发表于 2022-6-23 23:40:59
第二种复杂情况如图7所示,驾驶员可以通过拒绝短时喘振行程来延长喘振状态下开始的行程时间。影响取决于未来潜在行程的长度,即Ti(σi),以及这些行程期间的状态转换,Qi(σi),并纳入了Cand和定价方案。4.4定理3的证明草图通过操纵奖励函数对策略σ的导数,结果如附录所示。特别是,当定价函数具有适当常数mi,zi的给定形式时,任何策略σ={σ,σ}都可以通过向其添加更多行程来局部改进,即,随着驾驶员接受更多行程,总体奖励会增加:R(w,σ)>R(w,σ),σ(σ)。该结果如下uR(w,σ)>0,对于所有u,σ,给定约束,其中u是状态下策略的上限,σi=∪k(`k,英国)。关键步骤是找到该导数的有效约束条件,即给定形式的pricingfunction为正,给定任何σi,而不仅仅是σi=(0,∞). 这是因为激励相容性是集合函数R(w,σ)的全局条件。特别是,我们需要简单地表达这些约束,例如,作为Ti(0,∞)), Qi((0,∞)), 代替值Ti(σi),Qi(σi),σi R+。定理陈述中给出的C是mi,zi上的一组约束的结果。5个数字:激励与附加电涌的兼容性我们现在分析电涌政策,这些政策反映了当今叫车平台的实践。非高峰定价通常近似乘法,即w(τ)=mτ,其中mis为骑乘的基本时间(和距离)率。

32
kedemingshi 在职认证  发表于 2022-6-23 23:41:03
我们考虑两种类型的波动定价w,它们通过一个参数与w的关系不同:乘性波动:w(τ)=mτm≥ 最大浪涌:w(τ)=mτ+aa≥ 0倍增涌浪使用的乘数m大于基本票价m,MMI在热图上报告,如图1a所示;加性激增使用相同的基本票价乘数,mbut添加了热图上报告的系数,如图1b所示。考虑到激增状态下的固定原语和目标收益率,这些函数的计算非常简单。附录中的图8显示了与激励相容定价函数相比的这些类型的定价。乘性激增具有恒定的TW(τ)τ,因此与IC定价相比,短途旅行和长途旅行的费用较低。渐进加性波动(对于较大的τ)支付与多重非波动定价相同的费用,即limτ→∞w(τ)τ=limτ→∞w(τ)τ=m。因此,与IC激增定价相比,它支付的短途旅行费用过高,而支付的长途旅行费用不足。优步最近开始了从乘法激增到加法激增的转变。在本节中,我们认为,在利益相关的参数体系中,对于激励相容性,加法成分比乘法成分更重要。5.1计算最优驱动因素策略OREM 2确定乘法定价(以及更普遍的有效定价)通常可能与激励不兼容。然而,我们仍然希望比较各种类型的激增定价,并分析每种机制下的激励相容性。然而,要进行这种比较,需要计算出与apricing函数相关的最优驱动策略。回想一下,每个状态下的最优驱动策略σ是R+的某个子集。为一般定价函数w寻找这样的最优子集是很困难的,因此,由于计算的原因,定理2特别重要。

33
nandehutu2022 在职认证  发表于 2022-6-23 23:41:06
它确定,对于处于冲动状态的任何有效定价结构,所有驱动因素最优策略的形式为(0,t)∪ (t,∞), 对于某些t,t。我们仅1.0 1.5 2.0 2.5 3.0 3.5 4.0R21020304050λ2加性激增乘性激增(a)与R,激增状态收益率和λ,激增状态工作到达率。R∈ [1.1,3]在实践中很常见。2 4 6 8 10λ1→2246810λ2→1附加喘振乘以喘振(b)和λ2→1, λ1→2、世界国家变化率。λ2→1. λ1→2在实践中很常见。图4:每种类型激增的激励相容性。阴影区域是各方案在激增状态下激励相容的区域(σ=(0,∞) 是最佳的)。不改变时,λ=λ=10,λ1→2= 1, λ2→1=4,R=3.33,R=1,两种状态下的行程长度均按照形状为2且平均值为0.3的威布尔分布进行分布。我们假设在非喘振状态下可以接受每个Trip。需要找出这些参数的值,以最大化此表单集合中的驾驶员奖励,并且得出的政策是最优的;这种搜索可以通过网格搜索和数字集成进行处理。注意,该命题并没有建立驾驶员最优策略的唯一性;wethus选择最大化计算中接受的出行比例的策略。5.2结果我们现在研究了每种喘振机制与激励相容的机制。图4中阴影区域对应于激增定价函数在激增状态下完全激励相容的区域(σ=(0,∞) 是最佳的)。

34
可人4 在职认证  发表于 2022-6-23 23:41:09
例如,当R=2,λ=30时,加法喘振是绝对兼容的,而乘法喘振则不是。如附录B所示,RideAustin市场的数据表明,打车平台通常在以下参数范围内运行:(1)喘振的价值是非喘振的1.1至3倍;(2) 与非喘振周期相比,喘振周期较短(λ2→1. λ1→2);(3) 在典型的喘振中,驾驶员会收到多个跳闸请求(λλ2→1> 1,但较小),但仅完成一次或两次此类行程(λ2→1.≈ 平均行程长度)。与乘性激增相比,加性激增在这一机制中更具激励相容性,这支持了优步最近从乘性激增向加性激增的转变。我们还可以从对原语的敏感性方面得出定性的见解,类似于定理3中C形式的精神效果。图4a显示了与λandR相关的灵敏度。随着喘振状态下作业的到达率λ的增加,驾驶员拒绝一些行程变得最佳:“樱桃采摘”变得更容易,因为驾驶员可能会在喘振结束前收到更多的行程请求。类似地,随着激增与非激增相比变得越来越有价值(Rincreases),在激增状态下拒绝非有价值出行的动机增加。加性喘振包含一个有趣的非单调性:当R R、 上述影响占主导地位,长途旅行被拒绝。当浪涌状态比非浪涌状态更有价值时,加性浪涌有效地平衡了不同行程长度的费用,因此具有明显的兼容性。当这两个州的价值几乎相等时,最优驾驶政策再次拒绝长途旅行:我们的单一州模型近似于系统,因此加性波动可能与激励不兼容,参见定理1。图4b显示了喘振和非喘振相对长度的影响。

35
mingdashike22 在职认证  发表于 2022-6-23 23:41:12
在这里,两种类型的激增在对立的政权中是激励相容的。当λ2时→1λ1→2是大的,喘振是相当真实和短暂的,因此短途旅行自然被低估——接受它们会减少喘振状态下的时间花费——加性喘振是激励相容的。长时间喘振(小λ2→1λ1→2) 另一方面,在激增期间,世界几乎没有变化,因此乘法冲动变得与激励相容。在第6节中使用的RideAustin数据中,短期、频繁的喘振设置(其中加性喘振更好)占主导地位。尽管如此,我们的分析表明,当预计激增将持续一整天时,例如在可预测的需求冲击下,乘性激增可能更可取。(然而,出于透明度和沟通原因,在不同的支付功能之间切换可能是不可取的)。6喘振机制的实证比较我们现在使用来自RideAustin的公共可用trips数据研究各种喘振机制在实践中如何影响驾驶员收入,RideAustin是一家总部位于德克萨斯州Inastin的非盈利打车公司。我们表明,加性激增有效地平衡了短行程和长行程的相对价值,而平台在实践中使用的乘性激增定价方案相对低估了短行程和长行程的价值。在对实际司机付款的函数形式进行反向工程后,我们计算了现状(乘性激增)和模拟(加性激增)司机收入。

36
kedemingshi 在职认证  发表于 2022-6-23 23:41:15
对于每个付款方案,我们估计驾驶员在接收和接受给定行程请求时的价值,作为行程的函数,“价值”是指驾驶员在接受给定请求后90分钟内收入的增加(或减少)。我们注意到,这些数据并不是加性激增实验的结果,因此我们的分析描述了如果驾驶员行为没有改变,使用新的定价函数,驾驶员收入会发生什么变化。因此,加性激增练习是在现实环境中对此类定价函数的校准模拟:例如,当激增有两个以上的水平,并且可能不会以马尔可夫方式演变时,司机不会因开车到下游所需的时间以及位置起作用而获得报酬。此外,由于观察到的数据处于完整的三级水平(即驾驶员接受的请求),即使驾驶员行为发生变化,表明驾驶员在反事实世界中接受相同行程的结果也应定向保持。本节组织如下:第6.1节描述了数据、上下文和分析,第6.2节包含了结果。附录B部分包含支持性详细信息,数据(RideAustin,2017)和我们的复制代码都可以在线获取。我们不关心车手行为的变化,因为对于解耦定价,即使车手付款发生变化,车手定价也可以保持不变。https://github.com/nikhgarg/driver_surge_rideaustin6.1数据设置和分析说明此分析由2016年6月至2017年4月的丰富数据集实现,在此期间,IdeAustin经历了巨大的增长,是该地区最大的打车市场之一。数据处于已完成的跳闸水平。Komanduri等人。

37
kedemingshi 在职认证  发表于 2022-6-23 23:41:18
(2018)研究相同的数据集,并提供有关驾驶员收入、平台增长以及服务与公共交通关系的有用统计数据。我们认为,从2017年2月16日到2017年4月10日这段时间,(1)我们可以可靠地在这段时间内逆转平台的支付功能,(2)在此期间,基础市场相当稳定,除了一周的高、非典型需求和激增,与奥斯汀举行的SXSW音乐节相对应。(附录中的图10a显示了在此期间每天的行程)。我们放弃1小时以上或30秒以下的行程以及其他数据错误的行程;6440次这样的旅行被丢弃。我们分析了503383个完整的tripsby 3811驱动程序。(对于聚合多个行程的分析,例如给定时间段内的驾驶员收入,我们丢弃包含丢弃行程的聚合)。附录中描述了完整的预处理顺序。与其他公共可用的打车数据集相比,多个数据集的功能对我们的分析很有吸引力。最重要的是,每个RIP都有一致的驱动程序ID。其次,对于每次旅行,车手支付的总票价都有一个值,以及计算出的票价的条件:旅行持续时间(时间和距离)、付款率(时间和距离)、喘振系数、标准附加票价(皮卡)和旅行等级(普通vsSUV与豪华vsSUV)。这些功能使我们能够跟踪驾驶员在一天和一整年内的轨迹和收入,逆向工程RideAustin如何计算付款,以及模拟额外的激增付款。6.1.1构建支付函数为了模拟司机收入的增加,我们必须首先对平台实际总票价的计算方法进行反向工程,这是一项非常重要的任务,因为数据集中的计算随着时间的推移而变化,并且没有记录。

38
可人4 在职认证  发表于 2022-6-23 23:41:21
我们发现,目前的票价约为:最大(B+皮卡,MinFareForClass)×波动系数。B,(DistanceRate×Distance)+(TimeRate×T ime)是行程时间和距离票价,仅计算骑手在车内的时间(回想一下,当前的实践与理论不同,向骑手开车通常是无偿的)。定期旅行的最低票价为4美元,否则为10美元。浪涌系数1表示无浪涌,占跳闸的70%。它以0.25的倍数递增,97%的激增行程的系数最多为3。上述每个支付组件在数据集中以列的形式给出。然后,我们为每次出行构造以下付款,以模拟驾驶员如何使用附加涌浪,即使用基本票价的附加涌浪:最大值(B+皮卡,最小票价等级)+[(涌浪系数- 1) ×一个大演员。]a较大的波动系数(计算得出的)波动系数相关常数,其设置应确保此备用支付函数在每个波动系数上花费的总金额与status quo fare相同。换言之,替代性付款不会改变平均行程付款。我们的结果包括所有行程类别的行程,因为给定的驾驶员可能会跨行程类别进行交叉调度。付款包括乘数1.01和附加值2.02。根据公开信息,我们假设该平台收取固定佣金,不受行程长度的影响,因此司机可以收到除2.02美元以外的所有费用(RideAustin,2019)。平均而言,这一反向工程票价与总票价相差不到1美分。以激增因素为条件,但在没有激增的情况下,确实会改变资金分配给各种旅行的方式。这种选择反映了我们假设外生变量的理论,并消除了设置一个更大的参与者的任何自由度。

39
可人4 在职认证  发表于 2022-6-23 23:41:24
相反,如果我们使用一个单一的跨激增系数常数,那么对于相同的激增系数,与现状票价相比,基本票价加总费用可能会平均支付不同的金额。6.1.2匹配开放式驾驶员我们对驾驶员a的行程请求值感兴趣;为了计算这个值,我们需要一个反事实的测量:如果驾驶员不接受(或没有收到)长度为τ的行程,会发生什么情况。我们将每个给定完成行程的焦点驱动程序A与附近的驱动程序B进行匹配,该驱动程序B在请求时也可以接收行程请求。司机B的收入然后作为焦点司机a收入的反事实,因为司机a拒绝了请求。我们估计每个焦点驱动程序A的匹配情况如下。我们观察行程开始和结束时间和位置,但不观察驾驶员不在行程中的位置,甚至他们是否仍打开应用程序。我们还观察到驾驶员收到给定行程请求的时间,但由于数据导出错误,此时没有他们的位置。这些数据不允许我们简单地查询附近可能(但没有)收到给定出行请求的其他开放式驾驶员,因为我们不会直接观察驾驶员在不出行时的移动情况。相反,我们利用最近在附近完成的行程来确定仍在附近的驾驶员,如下所示。首先,我们定义了成对(日期时间、位置)元组之间的“匹配距离”。匹配距离小的事件发生在附近,时间相似。附录中规定了时间和地理距离加权的确切函数。对于驾驶员A的时间和位置,我们使用行程的开始位置(驾驶员所在的位置)和调度时间(驾驶员的请求被接受时)。然后,我们找到一位司机B,他最近在附近完成了一次旅行,还没有开始另一次旅行。

40
nandehutu2022 在职认证  发表于 2022-6-23 23:41:27
我们通过计算驾驶员A和每个最近完成的行程的目的地时间和位置之间的匹配距离来实现这一点。我们选择最接近的匹配项,筛选出与给定行程的驾驶员相同的驾驶员、在给定行程开始时间之前已经开始另一次行程的驾驶员或结束行程的驾驶员(在接下来的一小时内没有开始任何行程)。在附录中,我们提供了一种不同但互补的匹配方法的结果,以及有关匹配及其质量的其他信息。6.1.3计算驾驶员出行的价值我们现在通过一个我们称之为出行差异的概念来衡量出行对驾驶员的价值:给定特定的出行请求长度τ,期望驾驶员至少会接受请求,也会拒绝请求,假设未来会有一些行为。给定具有行程请求τ的焦点驾驶员A和匹配的驾驶员B,我们估计该指标,如图5所示:我们比较两位驾驶员在接受行程开始后90分钟内的未来收入,驾驶员A的收入高于匹配的驾驶员B,给定的行程请求τ越有价值。如果没有差异,即预期匹配的驾驶员获得相同的金额,则给定的驾驶员应在接受或拒绝请求之间“区别对待”。假设旅行定价错误,并且没有充分考虑驾驶员的暂时外部性。然后,不同长度τ的行程在交付给驾驶员的价值上会有所不同。我们期望TRIP差异与我们的激励相容性理论概念相关,如下所示。假设givendriver在接下来的90分钟内接受所有未来的请求。然后,如果支付方案与激励相容,则接受行程τ的给定驾驶员与匹配驾驶员之间的收益差异将至少为0。图5:焦点与匹配驱动程序的收益。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-4-30 09:57