RT,具体点的例子就是,如果有全国各省级单位的各种经济数据(例如GDP、就业、进出口),通过对这些指标进行主成分分析可以得到能够衡量各省级单位总体经济发展水平的指数以及各经济指标在这个指数的计算公式里的系数,但是如果想对某些由多个省级单位组成的大区域(如长三角、东三省、川渝、青藏)的经济发展水平进行量化刻画并比较(不对某个区域和某个省级单位进行交叉比较,仅涉及区域间的比较),利用对各省级单位的主成分分析得到的指数公式能做到吗?
注:
直接把各个区域的经济指标数据整理出来并进行主成分分析不可行,因为区域数量(样本量)常常少于经济指标数量(变量数量),kmo和Bartlett都没法做;
把各省级单位和各区域的数据放在一个样本总体里进行主成分分析我觉得也不行,从结果上看这样主成分分析得到的结果与只对省级数据进行主成分分析得到的结果差别不小(第一主成分的系数差别在0.01以上,第二及之后的主成分差异就更大了),从统计知识本身看这彻底破坏了样本间本该具有的独立性。