我得到了3 GB的机器生成数据,这些数据由Excel格式的120个传感器(每秒5条记录)提供。当前的任务是从数据中挖掘出有趣的模式(如果有)。
我将数据输入本地计算机中的R中,并进行了各种描述性和探索性分析,以得出一些见解。客户也正在为其机器寻找一些低成本的维护机制。因此,我想是否可以研究异常值并提供一些有关系统运行状况的信息。这也可以使用仪表板进行实时监控,如果可能,可以在不久的将来进行预测,以进行早期警报和预测性维护。
因此,这成为在120维空间中进行异常值检测的情况。现在,正如我所研究的那样,发现90列中的值在整个时间段内都是恒定的,对系统噪声没有任何影响。所以我丢下了它们。
马氏距离是在多变量设置中经过时间考验的距离函数。它用样本方差矩阵的逆来权衡各个欧几里得距离。
关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!