|
假定ρt,tt=1,。。。,它具有平移不变性和随机条件时间一致性。我们将证明σt满足(6)–(7)的存在性。公式(7)定义了空间V上的标准化单调风险度量。定义了固定ht∈ Xt,v(x)=ρt+1,t(Zt+1,…,Zt)(ht,x), 十、∈ 十、 V(ht+1)=v(x),如果ht+1=(ht,x),则为0,否则为。通过平移不变性和归一化,ρt+1,t(V,0,…,0)(ht,·)=V(ht,·)=ρt+1,t(Zt+1,…,Zt)(ht,·)。因此,根据平移性质和随机条件时间一致性,ρt,t(Zt,…,Zt)(ht)=Zt(ht)+ρt,t(0,Zt+1,…,Zt)(ht)=Zt(ht)+ρt,t(0,V,0,…,0)(ht)=Zt(ht)+σt(ht,Qt(ht),V)。这个关系链也证明了σt的唯一性。我们只需要验证σt(ht,Qt(ht),·)的假定定律不变性。如果V,V′∈ Zt+1具有相同的条件分布,给定ht,则定义2.7意味着ρt,t(0,V,0,…,0)(ht)=ρt,t(0,V′,0,…,0)(ht),以及(7)中的定律不变性。另一方面,如果存在这种转移风险映射,那么ρt,tt=1,。。。,这是由σ(ht,·)的单调性和定律不变性随机条件时间一致的。现在我们可以使用(6)来获得任意t=1,T- 1.无论如何∈ xtt表示下列恒等式:ρt,t(0,Zt+1,…,Zt)(ht)=σtht,Qt(ht),ρt+1,t(Zt+1,…,Zt)(ht,·)= ρt,t(Zt,…,Zt)(ht)- Zt(ht),是ρt,t的平移不变性。备注2.11。考虑到在受控过程中的应用,我们稍微滥用了符号,将分布Qt(ht)作为过渡风险映射的参数。例2.12。在风险敏感马尔可夫决策过程理论中,采用了以下一系列熵风险度量(见[18,30,13,39,5,12,15,27,4]):ρt,t(Zt,…,Zt)=γln进出口γPTs=tZsFti, t=1。
|