|
为此,在§5.2中描述的基线中。i、 我们改变了奖励函数,增加了所有州所有操纵行为的成本,直到-4.53并使用γ的相同值来求解(3)。表2再次显示了这种设置的结果,唯一的最佳措施是与诚实交易相关的措施。从监管角度来看,两种市场条件之间存在明显差异,一种考虑自由市场(基准),另一种考虑操纵者的定义。例如,在从表2开始的基线中:在奖励和转移函数的不同条件下,MDP模型的最佳行动。州基线增加了流动性定义的不确定性50%对50%10%对90%s↑, →, → => =>s=> ↓ , <= ↓s→, , => → →, => →, =>s↑, ↑ ↑, ↑, s↑, , => ↑ ↑ ↑s→ → → =>s→, => → →, => →, =>s↑, ↑ ↑, ↑, 国家情报局只需两步就能到达*(=> 在s;=> 在s)中,在实施定义后,最诚实的交易者将采取四个步骤(↓ 在s;→ 在s;→ 在s;和↑以达到相同的增长水平。iii.增加流动性的不确定性第二次尝试阻止欺骗行为是通过提供流动性操纵影响的不确定性。这可以通过采用§5.2中所述的基线来实现。i、 改变所有状态下所有操纵动作的转移函数。我们对不确定性采取了两种不同的测量方法:障碍切换/停滞的概率为50%/50%–10%/90%,目的是看看哪种测量方法可以消除欺骗。我们对γ取相同的值,然后求解(3)。表2显示了这种新设置的结果,我们得出结论,以某种方式控制流动性的实施机制不如将定义应用于操纵者那样有效。尽管对流动性的影响很模糊,但欺骗仍在发生。
|