我用stata考察一个虚拟变量(加上其他一系列的控制变量,如行业、年度、省份固定效应,也包括公司层面的一些特征,如规模、负债率、ROA等)对公司收到补贴的影响,因变量为补贴数据,大约有50%的数据是0,因为当年公司没收到补贴。因项目的需要,我需要将公司补贴数据用两种方式处理:一是将其对数化,处理方式为ln(1+公司补贴);二是直接用收到补贴金额(有50%左右的数据为0),不经过任何的scale处理。
回归结果显示,如果因变量经过了对数化处理,考察变量显著为正;而因变量为不经规模处理的数据,考察变量显著为负。结果很奇怪,按道理对数化是一种正向的转化,不应该导致相反的结果。我考察了两种数据的描述性统计,发现不经对数处理的绝对值的skewness和kurtosis,分别为7.35和65.97。而对数化处理后的skewness和kurtosis比较正常,为0.216和1.224。
我的问题在于不知道如何解释这种现象。同时希望能够找到方法和理由,证明不经对数化处理的回归结果存在严重问题,能否通过一系列的处理(stata),提供实际的统计结果证明我的判断。
急请问高手,应如何处理啊?很着急!!拜谢!!