影响制衣厂各工序工时(数值型数据)的因素有:面料(多分类无序变量,分类有100多种),款式(多分类无序变量,分类有7,8种),总件数(数值型变量),班组(多分类无序变量)
现在想达到两个目的:
1.分析各影响因素对工时的影响是否显著,并能看出各因素的影响大小
2,建立多输入(各影响因素),单输出(工时)的模型,要求输入某工序对应的面料,款式等影响因素,即能输出对应工时。
问题:
1,对于第一个问题,我尝试用单因素方差分析来看影响是否显著,但数据不是正态分布,且不能通过方差齐性检验,看了论坛中有些回答,用了非参数检验(秩和检验),这样处理合适吗?应该怎样处理。
2.对于自变量为分类数目较多的多分类无序变量,因变量为数值型变量,一般应该怎样进行数据建模(不一定用SPSS)呢?
3,由于分类数目较多,我是否可以通过聚类分析来减少各自变量的分类数目呢?
对于上述建模要求,请问有什么好的处理分析以及建立模型的方法吗?(非统计专业出身,实在不懂啊)附件为部分数据格式


雷达卡





京公网安备 11010802022788号







