本文通过来源于2022第二届中国高校大数据竞赛A题提供的数据,该数据记录了某企业机械设备的使用情况及故障发生情况,可以用于设备故障预测及故障主要相关因素的探究。本文首先对给出的数据进行数据预处理和特征提取,选择合适的指标用于设备故障的预测;之后为了判别机械设备是否发生故障,本文建立二分类模型并对其进行评价,而对于发生故障的具体类别的判别,则建立多分类模型并对其进行评价。然后,利用赛题所给的数据进行预测,补全给出的数据;最后建立属性对应关系来探究各类型与特征间的关系。
本文最后解释了各故障类型与特征之间的关系,并对模型进行了比较和总结,发现决策树模型和XGBoost模型表现更好。
压缩包中有代码数据论文报告。