本人基本属于统计小白……发帖求助各位专家。
我有一个地区各种出口商品价格的样本,每种商品的样本量基本大于10000,最多的20w+,最少的也有5000+
然后根据这个样本,给该地区同类出口商品划定一个价格区间,如果下次有同样商品出口,判定其价格是否过高。
我先用格布拉斯法或者3倍标准差法剔除这个大样本的离群值,然后划定x±s为正常值,x±2s为警告线,x±3s为控制线。然后结合实际情况,确定商品的正常价格,超过警告线或者控制线则告知相应的价格异常风险。
但是,我搜索一些资料表明,剔除异常值和划定警告线、控制线都要求样本服从正态分布,但是我手头上的这些样本,即便是20w+的样本,均呈现正偏态分布。
那么我采用的这个价格区间划定的方法是否可行,应该怎么办?