目前手上有两组性能抽样连续型数据(每10分钟取样一次),其中一组的数据是优化前数据,另一组是优化后数据,各7000个。想在两组数据作比较,看优化前后变化是否显著。
问题是,这些数据中有大量的0值数据(无访问量时为0值),导致数据严重偏峰非正态。
目前考虑:
1,由于数据量大,直接T检验是否有效?
2,如果转成正态这种情况应如何转?
3,如果将现有数据,按每2小时12个数据进行累加,可以将现有数据缩减为每组600个非0值数据,然后再进行正态转换,这样的比较是否可行。
4,如果数据正态考虑再进行重复度量分析,是否适用?
5,由于对性能预测不作考虑,时间序列分析是否不需要。