|
BEZERRA、ALBERTO OHASHI、FRANCESCO RUSSO和FRANCYS DE Souzab,其中B(Skn)是由Snk生成的Borel-sigma代数;n≥ 我们设置Ak:=0(R×Rd中的空向量)和Sk:={0}。系统法则将根据PKN(E)中定义的以下概率度量进行演变:=Po Akn(E):=P{Akn∈ E} ;E∈ B(Snk),n≥ 本文的主要目标是处理非马尔可夫系统。先验地说,奖励过程中没有马尔可夫半群可供我们使用,因此我们需要在我们的上下文中替换这个经典概念。根据定义,Pkn(·)=Pkr(·×Sr-nk)对于任何r>n≥ 1、更重要的是,Pkr(Snk×·)是一个正则度量,B(Sk)是可数生成的,因此已知(见Dellacherie和Meyer[10]中的III.70-73),存在(Pkn-a.s.unique)一个崩解νkn,r:B(Sr-nk)×Snk→ [0,1]实现了espkr(D)=ZSnkZSr-nkD(bkn,qkn,r)νkn,r(dqkn,r | bkn)Pkn(dbkn)每D∈ B(Srk),其中qkn,ris是bkronto到la st(r)的投影- n) 组件,即qkn,r=(skn+1,~ ikn+1,…,skr,~ ikr),列表bkr=(sk,~ ik,…,skr,~ ikr)∈ Srk。如果r=n+1,我们表示νkn+1:=νkn,n+1。根据定义∈ B(Sk)和bkn∈ Snk,我们有(2.5)νkn+1(E | bkn)=Pn(Tkn+1,ηkn+1)∈ E | Akn=bkno;n≥ 换言之,νkn+1是混凝土型骨架D从步骤n过渡到步骤n+1的概率。接下来,我们为转换内核(2.5)提供了一个闭式表达式。对于给定的bkn=(sk,~ik,…,skn,~ikn),我们定义(2.6)λ(bkn):=最大值{1≤ j≤ n(ikj)=λ},其中在(2.6)中,我们使最大{} = 此外,对于给定的bkn∈ Skn,我们设定:=ik,ikn我们定义λ(ikn):={在λ坐标中发生的向量ikn中的跳跃次数}。例如,如果ik=(-1, 0), (0, 1), (1, 0), 然后(ik)=2。
|