散点图用于寻找数据的主体模式,其个体的99%的置信区间,可以帮助用户找到可能的异常信息。实际上,常见的多变量模式分析中多半也借助散点图功能,来检查异常信息,当然同时也提供了多变量的线性关系信息,像用户可能遇到的问题(见下图)。
下面根据因变量与自变量数量、测量标准的综合信息,来提取主成分或某种得分(本质上都是提取主成分),作为绘制散点图的依据。下图以“因变量个数与类型“为核心。
①12点钟方向:因变量只有一个,且为离散性变量,多个自变量使用典型判别分析,那么因变量(转化成虚拟变量)、自变量位置上均可以提取典型得分,这些得分用于绘制二维的散点图。当然如果是一个自变量,这自然好处理(下面也不在强调一个自变量的情况)。
②6点钟方向:因变量只有一个,且为连续性变量,多个自变量使用主成分分析,对多变量提取主成分信息,或使用总因子得分,这些降维后的信息就可以用于绘制二维的散点图了。
③3点钟方向:因变量有多个,且为离散性变量这的种情况,多数要视具体情况而定,但一般性的方法有助于启示用户方法的选择,如果于此相对的有多个自变量可以使用的方法,如潜在类别分析技术的处理、典型得分(也可以使用典型判别),有时根据变量及其类别间的线性关系等信息也可以使用最优尺度转换,从而寻求比较简单的主成分提取等方法,那么最终就可以获得二维关系的散点图。
④9点钟方向:因变量有多个,且为连续性变量,于此相对的也有多个自变量,常用的处理过程,如使用结构方程的潜变量得分、典型得分在变量间的双向关系和单向关系时均适用,主成分分析等。
由于多维信息在理解上的限制,总是寻求变量间的低维关系来绘制图形,以期帮助分析人员了解变量间的关系。在预分析中,介于所见关系,其实大多都在寻求此道。