现在在做一个项目,但是有点没有头绪,所以请大神们指教一下!
我现在手里有64张table,关于住户用水的,里面最主要看的一张是日均用水量的,有100万条左右的数据,结构是
account number && reading date 1 && consumption1 && .... &&... reading date 18 && consumption18
所以这里daily average consumption 是consumption(i)/[date(i)-date(i-1)]
现在的想法是首先挑出来outlier 然后用剩下的数据去找到住户typical的用水量是多少
但是现在就有几个问题,一个是怎么去挑坏数据
第二个是我只知道每一户的类型(比如自家住宅,townhouse,还是商业用地)但是不知道有多少人
用什么方法呢?做回归?还是AMRA?
求大神们指教!在线等!挺急的!