陈晨_ 发表于 2022-2-9 15:24
你好,我想问一下,我做企业类的技术创新效率研究,用不用把投入X1和产出Y1,Y2;投入X2和产出Y1,Y2做相关 ...
您所述课题,正好是DEA的应用。
企业数据的水分问题,这个也没什么好办法,哪怕是上市公司的财务报表也可能是不准的甚至是假的。
只能尽量找规范一些的可比公司的数据。如果是写毕业论文的话,重点放在方法是否正确,数据标明来源即可,反正又不是自己造的数据。但如果做实证研究,那数据水分就会影响结论,问题就大了,推不出人家想要的结论,可能经费就泡汤了。但这其实是个系统性问题,依赖别人的数据就会遇到这种问题,要么明知不可为而为之,要么用结论去倒推数据,要么辛苦一些实证调研去拿真实的数据。
你说的相关性分析,是想先看一下某个指标是否对投入产出结构有统计意义吧。其实DEA关注的是样本之间的相对效率评价,多个投入变量是整合在一起的,多个产出变量也一样,这里留意一下变量选择具有现实意义且合理就好,个人认为能充分说明投入产出结构且相互不重叠即可。DEA模型会替你处理变量的问题,没有必要做相关性分析。
当然,在DEA分析之前,也可以对所有样本的各变量做统计性描述,比如分布、相关性分析,方差分析等等,但这些只是做一个铺垫,与你要做的效率比较是没有关系的。