|
然而,请记住,在他们的设置中,当前状态是可观察的,因此它总是可以决定必须选择哪个阈值级别。在我们的例子中,由于当前状态是连续估计的,所以我们只有一个阈值。我们看到,最优股息政策的数值近似是阈值类型,阈值水平b取决于漂移的估计,因此其形式为ut=K1{Xt≥b(νt)}(Xt)。因此,研究这类策略的可采性具有重要意义。问题是图3:K=1.8的结果值函数。图4:K=1.8(蓝色)的结果值函数与贝叶斯案例(红色虚线)的结果值函数进行比较。系统xt=x+Zt(νs- k1{Xs≥b(νs)}(Xs))ds+σWt,(20)πi(t)=pi+ZtqMi+M-1Xj=1(qji- qMi)πj(s)ds+Ztπi(s)ui- νsσdWs,i=1,M- 1,(21)与(10)中的一样,有一个解。由于该SDE的漂移系数是不连续的,因此无法应用SDE文献[33,定理2.2]中的经典结果。然而,对于满足[27,定理3.20]假设的阈值水平b,我们得到了系统(20),(21)的唯一全局强解的存在性和唯一性。5摘要和结论我们提出了保险公司盈余过程的扩散模型,其中漂移系数随经济环境的变化而变化。经济环境的变化是用马尔可夫链建模的,不允许观察马尔可夫链的当前状态引入了不确定性。我们已经通过应用随机滤波理论的结果,展示了如何在这种情况下克服不确定性。
|