我来尝试回答一下为什么把变量时间往后对齐可能不严格。
1. 个体的控制时滞,和整体样本的时滞不是一回事。对于单个个体而言,可能从一次控制策略X,到得到Y得分可能有个大概确定的时滞,但是我们进行回归的时候往往是包含了很多大时间跨度的样本,这些整体的样本之间的已经包含了双向因果影响。我们对双向因果的分析,不能考虑单个个体,也要考虑整体样本。
2. 数据的统计/公布,和数据的产生过程不是一回事。例如,X,Y数据的统计是有一个比较长的周期(比如一年)。但你实际考核的商业系统行为中,可能一个季度就出现了一轮X Y之间的相互影响,那么一年就形成了多轮的因果循环。加上不同产品、不同行业、不同企业从市场反馈到竞争策略的闭环周期不同,所以你哪怕只用了一年的数据来做“对齐”,也就是只包含了一个轮公布的X和Y,但X和Y之间的双向因果的内生性已经产生了。
以上只是两个原因,可能不尽完善。总之,根据实际考核的对象中X-Y数据的产生机理,可以判定你简单做时间对齐,是不是合理的。