在进行Probit回归时,理论上因变量应该是一个二分类(0/1)的变量。然而,在实际应用中,有时你可能遇到的是一个被处理成连续值接近0和1但不严格是这两个数值的情况。尽管如此,Stata允许使用这些“软”二分变量作为响应变量进行Probit回归,并不会报错。
当你说用变异系数法加权生成的新变量不是严格的0/1变量时,这实际上意味着你的数据已经被处理成了一种类似概率的形式。在这种情况下,虽然严格来说这不是一个标准的二分类问题,但使用Probit模型依然是可行的,因为Probit模型本身就是用来预测概率的。
你提到将接近零的值设为0,其它所有非零值设为1,并再次运行Probit模型。这种操作在一定条件下是合理的,尤其是当你认为数据中的“软”二分类可以合理地被简化为一个真正的二分类问题时。这样做可能会使你的模型更加符合理论假设,从而可能得到更可靠的结果。
然而,在进行这样的转换之前,你应该考虑:
1. **合理性**:检查原始数据的分布和加权后的变量,确保这种转换逻辑上合理并且没有过度简化复杂性。
2. **信息损失**:将连续或接近二分类的数据转为真正的0/1值可能会丢失一些信息。评估这是否会影响模型的结果解释。
3. **模型选择**:虽然你倾向于使用Probit,但根据数据的性质和研究问题,也考虑其他可能更适合的模型。
最后,无论采用何种方法,都应在报告或论文中清楚地说明你的处理过程以及为什么认为这种方法合理,以提高结果的可解释性和透明度。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用