|
我们需要计算我们可能有多少个组合,包括重复,前提是排序不计算,并且一些插槽可能保持为空。这样的数字n*容易获得:n*=(n)-1) Xi=0(n)-1.-i) Xj=0(n-1.-我- j) Xk=0(n-1.-我- J-k) Xh=01=4!Yi=0(n+i)。通过DPP,我们可以通过向后递归来解决上述问题。特别地,假设Q是区间[T]的最优策略- (n)- 1), [T]。然后,值函数由v指定T- (n)- 1), x、 y,s,Qam,Qbm,Qal,Qbl= y+xs+c(T)- (n)- 1)) -k+εmQam+Qbm+金伯利进程- εlQal+Qbl- Kx+Qbl- 卡尔p+Qbm- Qam+c(T)- (n)- 1)),其中P[z=1]=P和P[z=0]=1-p、 价值函数VT-N, x、 y,s,Qam,Qbm,Qal,Qbl=五、T- N,Qam,Qbm,Qal,Qbl是由男B:VQam,Qbm+1,Qal,Qbl如果x<min-εm2k- 1.-\'x,εl- 2k- εm2k(1)- p)-P-\'x,磅:五Qam,Qbm,Qal,Qbl+1如果εl- 2k- εm2k(1)- p)-P-\'x<x<-εl2kp+1- P-\'x,DP:VQam,Qbm,Qal,Qbl如果麦克斯-εm2k- 1.-\'x,-εl2kp+1- P-\'x≤ 十、≤ 闵εm2k+1-\'x,εl2kp-1.- P-\'x,LS:VQam,Qbm,Qal+1,Qbl如果εl2kp-1.- P-\'x<x<-εl+2k+εm2k(1- p) +p-\'x,MS:VQam+1,Qbm,Qal,Qbl如果x>maxεm2k+1-\'x,-εl+2k+εm2k(1- p) +p-\'x,“x”在哪里=Qbl- 卡尔p+Qbm- Qam+c(T)- N). 如果εl<p(εm+3k+pk),则限制买入订单和限制卖出订单永远不是最佳选择。以限制购买订单为例。在每个时间点,当且仅当库存x满足εl时,它们才是最佳选择- 2k- εm2k(1)- p)-P-\'x<x<-εl2kp+1- P-\'x.(4.1)要存在这样的x,必须有εl- 2k- εm2k(1)- p)<-εl+kp2kp<=> 0<εl<p(εm+3k+pk)。同样的条件也适用于限价销售订单的存在。由于上述条件既不取决于时间,也不取决于迄今为止遵循的策略,我们可以将其视为一种与时间和策略无关的条件。按照类似的程序,我们发现上述条件也确保了限价销售订单的存在。
|