做了一个问卷调查,问卷各个题目都是5点评分,用因素分析把各个题目分成了8个因素,然后想用K-MEANS聚类把人群聚成几个类别。看了几个论文,发现它们的结果中,分数居然有负的,而且分值都是围绕0分分布,这是怎么回事呢?按道理,1-5点评分应该围绕3分布,且没应该有负分阿,如图:
其它论文中的结果
┌───────┬───┬───┬───┬───┬───┐
│ │集群一│集群二│集群二│F值 │显著值│
├───────┼───┼───┼───┼───┼───┤
│因子1品牌认知 │0.092 │-0.317│-0.173│6.643 │0.002 │
├───────┼───┼───┼───┼───┼───┤
│因子2质量认知 │1.138 │0.312 │0.875 │74.677│0.000 │
├───────┼───┼───┼───┼───┼───┤
│因子3价格认知 │0.598 │0.151 │0.067 │14.905│0.000 │
├───────┼───┼───┼───┼───┼───┤
│因子4时间节省 │0.388 │-0.07 │0.389 │14.853│0.000 │
├───────┼───┼───┼───┼───┼───┤
│因子5流行新奇 │-0.29 │-0.428│-0.093│10.885│0.000 │
├───────┼───┼───┼───┼───┼───┤
│因子6购物困扰 │0.82 │-0.07 │0.203 │51.549│0.000 │
├───────┼───┼───┼───┼───┼───┤
│因子7购物冲动 │0.215 │0.06 │0.025 │6.871 │0.001 │
├───────┼───┼───┼───┼───┼───┤
│因子8信息意识 │0.615 │0.12 │0.945 │54.048│0.000 │
└───────┴───┴───┴───┴───┴───┘
而自己的结果是这样:
Final Cluster Centers Cluster 1 2 3 4
决策困惑 3.0157 2.6586 3.2326 3.6594
注重信誉 3.9635 3.0990 3.2744 4.1266
新颖时尚 2.7478 2.6313 3.5310 3.7871
借鉴推荐 3.8109 2.7904 3.2636 3.9492
消遣娱乐 3.8348 2.5118 3.2248 3.6979
精打细算 3.8319 2.7441 3.3876 3.9974
重视品牌 2.8217 2.6919 3.0620 3.5898
请教:
1、其它论文中(第一个结果)的负分是怎么出来的呢?难道这些分值不是各个因素在不同分类中的平均数?
2、对于我自己的分析结果(第二个)怎么命名呢?好像所有因素在第4类上的得分都最高??而且,‘重视信誉“这个因素在各个类群上得分都是自高的,这样怎么分析呢?
十分感谢
[此贴子已经被作者于2009-4-13 15:55:15编辑过]