在建模过程中,有一个问题曾经让人困扰。取对数时,哪些变量可以不用取?简而言之,连续性变量(变量值>0)应该取对数,而对于虚拟二值变量则不用取对数。部分变量有负值或者零值怎么办?根据对数函数性质,变量值须为正数,所以如果对负数或0值取对数,则stata将该对数值视为缺失值。
在文献学习过程中发现,在这一块,大家的操作不一而终,举例如下:
黄亮雄等(2021)的研究中,比例型变量均未取对数,比如:控制变量中第二产业占GDP比重、城镇化率等,而解释变量和核心解释变量均取对数了。Meijers and Burger(2010)的研究中将所有非虚拟变量(non-dummy variables)均取了对数,包含很多比例型数据。
部分参考文献:
杨波,崔琦.中国中小机场该不该补贴?——基于城市经济增长和溢出效应的视角[J].经济经纬,2018,35(02):1-6.
黄亮雄,王震,王贤彬.地方经济增长目标对外商直接投资的影响与机制研究[J].国际经贸探索,2021,37(02):51-66.
Meijers E J,Burger M J.Spatial Structure and Productivity in Us Metropolitan Areas[J].Environment and planning A,2010,42(6):1383-1402.