|
然后,如果接受所有作业请求相对于w是最优的,即σ=(0,∞) 在单态模型中,或σ={(0,∞), (0, ∞)} 在动态模型中,相对于w是最优的。换言之,如果收益最大化的驾驶员(知道所有原语w和请求时的行程长度τ)接受每个行程请求,则支付函数w是激励相容的。现在,我们分析每个模型的驾驶员终身收益率R(w,σ)。2.2.1司机收入在单一状态模型中,在单一状态模型中,原语直接诱导更新奖励过程,其中给定的更新周期是司机在完成一项工作后新开的时间到他们再次开的时间。设W(σ)为行程τ的平均收益∈ σ、 即更新周期内的预期收益;设T(σ)为可接受行程的预期等待时间和atrip的预期长度之和,从而为预期更新周期长度;设F(σ)为驾驶员收到σ请求的概率。然后,终身驾驶员平均小时收入(收益率)isR(w,σ)=w(σ)T(σ)=F(σ)Rτ∈σw(τ)dF(τ)F(σ)λ+F(σ)Rτ∈στdF(τ)第一个等式源自更新奖励定理,在动态模型中概率为1.2.2.2驾驶员收入。另一方面,对于动态模型,我们不能直接使用更新奖励定理,更新周期仅包含一次行程。司机在一次给定旅行中的收入不再依赖于其他旅行的收入:如果一份工作是在激增状态下开始的,司机的下一份工作更有可能也是在激增状态下开始的。然而,考虑到每项工作是否在激增状态下开始,工作收入是独立的。我们可以用这个性质来证明下一个引理,它给出了动态模型中的驾驶员收益率。
|