有10张只有5种颜色构成的照片,每张照片的像素为20*20,每张照片由5个单独颜色的图层叠加而成(即共50个图层),这5种颜色在不同照片中(或者在同一照片的不同像素中)可能有也可能没有相关性。
为了研究这些颜色之间(且2D分布上)是否有关联,我以颜色为变量,像素点上的颜色强度为观测值(即5列400行的数据矩阵,用SPSS),对每一张照片分别进行主成分分析,主成分数都设定为3。这样可以获得每张照片的loading,且数据矩阵格式一致(3列5行)。
接着,为了对这10张照片根据颜色的相关性和重要程度进行分类,我把每张照片的loading转为一列,作为观测值,以照片为变量,进行R型聚类分析(数据矩阵为10列15行)。
请问这样根据PCA的loading进行R型聚类,在统计学上的理论意义正确吗?