无论你是刚刚入门的数据小兵,还是已经成为精明干练的数据精英。干数据分析前,我们必须想的两件事儿:
1、融化分析的目的
当一推数据,拿到手上时获悉数据基本的内容外,看到数据,你得在心里估摸着:通过这些数据,我们能得到什么。不能空口白话,在没数据的支持,那样只会显得空洞。常见的如,市场的需求多大?什么时候适合进入市场?商品的定位?客户群体的定位?因为,目的不总是老板给你,而是你作为老板的眼睛,告诉Ta能得到什么。
2、保证数据本身的质量
保证数据的质量是数据分析的前提,挑出异常值、冗余值,为数据分析提前排除相关的错误因素。数据质量,注意从五个方面来考虑:
真实性
常常说拿真实的数据,说真话,并不是没有道理(如当我们考虑到对市场的投入量时,真实的数据可保证商品在市场的转换率)
完整性
数据的内容是否缺省,符合数据本身内容的完整(如某个字段是否完整,都很可能影响分析的结果)
一致性
数据的记录是否符合统计的内容规范和逻辑上基本规律,是否保持的一致。(如数据库中,对某个字段的类型和长度的定义)
准确性
数据中存在的一些异常值,有时候不是拿规则就能除去的,在排除时,我们应该注意异常的提示信息,并且要考虑到排除后是否会影响到分析的结果。(如某值介于常规值和异常值的分界线上)
时效性
对于数据本身来说,合适的数据时段,便能保持数据的有效性。(如错时段的数据,很可能对市场定位就会造成不小的损失)