|
分配给政策问题i的资源量由pi确定,t=qi,tPNjqj,t,(10),其中qi,是指分配资源给政策i的倾向,定义为qi,t=(Ti- Ii,t)(Ki+1)(1- θi,tfR,t),(11),其中Ki是节点i的传出连接数,也称为其出度。方程式11总结了ZF如何调整其政策重点的直觉。注意,等式10和11使用的公式与强化学习模型中的公式相似【Dhami,2016年】;然而,在这种自适应启发式中,学习过程仅由腐败动态通知。首先,ZF试图缩小差距- Ii,t在目标和指标之间,以最小化等式8。其次,KI代表了政策问题的重要性。也就是说,政策问题对发展进程至关重要,因为它们会在其他问题上产生溢出效应;因此,对此类政策的投资更有助于达到指标的目标。第三,ZF试图达到˙T,同时试图通过减少分配给那些被发现挪用资金的官员的政策来遏制腐败。这些预算变化不一定意味着对公务员的直接惩罚。尽管如此,预算调整是ZF向官僚发出的一个信号,要求遵守纪律,并提高其未来的贡献。预算变化取决于ZF通过法治执行其决策的能力(这就是为什么fR,t乘以θi,t)。另一种解释是,糟糕的法治意味着中央当局在发现腐败迹象时并不真正有兴趣发出信号。最后,分配给策略i的资源量isPi,t=pi,tB。
|