|
对数似然过程取决于仅通过信号τ,…,的(随机)定时选择的效果,τn.引理1即使在同一时刻τi出现多个信号也适用,但该事件的概率为零,因为信号过程是泊松过程。如果对于某些^l,策略的特点是e*G(l)>e*B(l)代表l∈ (十一)- ,^l)安第斯*G(l)<e*B(l)代表l∈ (^l,^l+), 那么^l是一个停滞点。附录中详细描述了停滞点。它发生在一个点^l上,该点的对数似然比从^l的正上方和下方漂移到^l。对数似然比不会偏离停滞点,但可能会在另一个方向上跳开。考虑到策略e*= (e)*B、 e类*G) 市场期望发送方选择,从实际选择效用函数eθ(·)中得到的θ型效用是预期的流动报酬贴现总额eθl(e*) = EeθZ∞经验值(-rt)[β(lt)- cθeθ(lt)]dte*, lt=0=l, (3) 其中,期望值超过随机过程(lt)t≥0,给定eθ(·)。根据每种类型最大化(3)的eG,eB是否满足(eG,eB)=(e),由(3)给出平衡路径的支付*G、 e类*B) 。计数率r>0。给定策略e*根据市场对发送方的期望,eθ上的上数(3)表示为Vθ(l)。如果市场期望采用马尔可夫平稳策略,那么每次达到给定的l时,θ型的连续值Vθ(l)都会得到很好的定义,并且与导致l的路径(lt)无关。Vθ(l)对e的依赖性*在符号中被抑制。如果e*G(l)=e*B(l),那么(lt)永远保持在l,Vθ(l)=R∞经验值(-rt)β(l)dt=β(l)r。值Vθ(l)的上边界为βmaxrand,下边界为βminr。定义1。马尔可夫平稳均衡由策略e组成*=(e)*G、 e类*B) 发送方和对数似然比过程(lt)t≥0秒。t、 1。给定(lt)t≥0,e*θ在eθ2上最大化(3)。
|