|
达到任意边界状态后,进行控制,包括传输进程nbξko∞k=0到一个内部状态。这种转移由概率分布α(0)描述=α(0)l,l=2,3,N,α(1)=α(1)l,l=2,3,N. 我们说一对给定的概率分布α(0), α(1)形成控制主要随机过程nbξko的策略∞k=0。同时,进程nbξko∞k=0在命中到边界状态之间的时间段内是不可控制的。该随机模型中最优控制的数学问题是找到一对概率分布α(0)=nα(0)l,l=2,3,否,α(1)=nα(1)l,l=2,3,不,这为效率的固定成本指标提供了一个极值。随后将给出此类指标的定义和最优控制问题的形式化表述。我们引入另一个辅助随机对象,即随机序列{ζn}∞n=0,与主进程nbξko相关∞k=0。我们假设过程{ζn}∞n=0由比率ζn=bξbν(n),n=0,1,2。因此,随机序列{ζn}的值∞n=0在后一个进入边界状态时,与主过程的值合并。显然,随机序列的元素{ζn}∞n=0在集合Z={0,1}中取值。注意,引入的随机变量序列{ζn}∞n=0形成马尔可夫链。实际上,我们确定了一个随机时间点bν(n)=kn,过程状态ζn=bξkn=sn∈ {0, 1}. 然后是过程{ζn}的进一步演化∞n=0将由主过程nbξko的演变确定∞时间点kn后k=0。反过来,进程nbξko的演化∞k=0根据概率分布α(sn)确定KNMONT后的立即值=α(sn)l,l=2,3。
|