在使用`reghdfe`命令时出现"重复变量"的错误提示,通常意味着你的模型里有部分因子被定义了两次或者以不同的方式组合导致Stata认为是相同的预测变数。在你给出的命令中,确实存在这种可能。
例如,在你的回归公式中有:
- `c.ln_last_mile_delivery_time_h##c.ln_last_mile_delivery_time_h`:这行代码试图将`ln_last_mile_delivery_time_h`这个变量与自身进行交互作用,实际上是没有意义的,并且会被Stata识别为重复。
- `c.num_orders_by_lh_max##c.num_orders_by_lh_max##c.W2_h`:同上,这里也是尝试创建一个变数与其自身的交互项,再与`W2_h`变量交互。
另外你还在每个交互项前加上了"c."。这通常用来指定连续(continuous)变量,但是在一个变量与其自身进行交互作用时,并没有实际意义。
修改建议:
- 删除`c.ln_last_mile_delivery_time_h##c.ln_last_mile_delivery_time_h`
- 将`c.num_orders_by_lh_max##c.num_orders_by_lh_max##c.W2_h`改为仅与`W2_h`的交互项,或者你真正想做的其他组合。
修改后的命令可以是:
```
reghdfe ln_installation_time_h c.ln_last_mile_delivery_time_h total_volume holiday num_orders_by_lh_max c.num_orders_by_lh_max#c.W2_h if order_amt==1 & installation_time_m >=5 & last_mile_delivery_time_h>0 & installation_time_h< 24 & last_mile_delivery_time_h
```
请注意,上述命令只是一个示例,你可能需要根据你的研究需求调整变量和交互项。在删除或修改那些“重复”的预测变数后,你就能避免"重复变量"的错误信息了。
最后,我注意到你的条件语句中`installation_time_m`和`installation_time_h`这两个变量名不同,尽管看起来像是在指同一个概念的不同度量(分钟与小时)。如果它们实际上代表的是相同的测量,请确保在使用这些变数时的一致性。如果他们确实不一样,则请根据研究需求确定正确的条件。
希望这能帮助你解决错误,并正确执行你的回归分析!如果你有其他问题或需要进一步的帮助,随时告诉我。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用