连老师,您好。
我近期数据整理完毕,是10 year panel data。正在做data management, 删除outliers,然后做OLS regression。
dependent variable是return on sales (即profit margin).
其中一个关键independent variable是介于0到1之间的一个比率数据FSTS,即一个跨国公司的foreign sales divided by total sales.
在stata中运行histogram FSTS,color(green) freq normal bin(100), 发现FSTS不是正态分布,尾巴在右边,大部分数据和惟一的顶峰在分布图的左边,值在0到1之间。
如果用FSTS作回归的话,FSTS的p值是0.182,FSTS这关键变量不显著。
如果对FSTS取对数后,用lnFSTS作回归的话,lnFSTS的p值是0.039,lnFSTS这关键变量显著。
我有2个问题
1. 请问这种情况下我可以对FSTS取对数吗?
2. 换句话说,对于数值型数据如number of employees或者total assets之类的我知道一般是可以取对数的(我的目的是让它接近正态分布),但是对于比率型数据(介于0到1之间)可以取对数以让它接近正态分布吗?
请连老师抽空指导一下,谢谢啦!