|
这里,φt=Kq˙L(t)(v2,1cep- v) ,(3.2)和v2,1是v的第一个分量。常数K>0必须满足Kq˙L(t)≤ 1、算法1给出了这些定价步骤。算法1:GLM定价算法初始化:选择L∈ 五十、 在p中选择线性独立的初始价格向量p(1)、p(2)、p(3)≥ 3: 估算:计算bβtusing(2.4)。定价:(I)Ifbβt不存在或tr(P-1吨)-1. L(t),然后设置p(t+1)=p(1),····,p(t+j)=p(j),这里j是满足tr(Pt+j)的最小整数-1)-1.≥ L(t+j)。(二) Ifbβ测试者和tr(P-1吨)-1.≥ L(t),然后我们设置p(t+1)=pCEPA和considertrPt+p(t+1)p(t+1)>-1.-1.≥ L(t+1)。如果不成立,我们将p(t+1)=pcep+φ和φ设置为(3.2)中定义的值。这里我们可以选择kφtk=˙L(t)1+最大值∈Pkpk, 以满足上述要求。以下命题保证在选择价格时,价格分散条件(3.3)得到满足。命题3.1。Ifbβ测试者和tr(P-1吨)-1.≥ L(t),我们将下一个价格设置为p(t+1)=pcep+φt,然后Pt+p(t+1)p(t+1)>-1.-1.≥ L(t+1)。(3.3)证明。见附录A.3.2。自适应GP定价模型在GP设置中,我们根据置信上限(UCB)规则确定定价策略。Westart回顾了Srinivas等人的工作【13】,其中后GP用于构建UCB功能。在每个时间步t-1,他们将下一个采样点设置为最大化UCB函数的采样点,给定值为pt=arg maxp∈Put-1(p)+√Дtσt-1(p)。此处,后验平均值ut-t后得到1(·)-1观察值,是f的当前估计值。后标准偏差σt-1(·)是与该估计相关的不确定性。
|