准备从事数据分析师及刚从事数据分析师的同学一定要记住。最怕那种不懂装懂,上来说问你处理过多大数据量,你做过多个机器学习模型,你做过多少个数据产品!没有做过这些内容,好像数据分析就没有任何价值。
我们举个场景来说明这二种价值的体现。某个企业,某周业务团队发现本周销售额发现没有达到之前设置的目标,假设是月累计完成率。我们假设有二种数据分析场景:
1)通过数据拆解定位是某个区域的销售远低于目标
那数据分析师如果对业务很理解,可以会假设各种原因。例如:是否缺货,是否竞争对手搞活动,是否取消与第三方的合作,是否定价过高,是否服务质量下降,是否促销效果不好,是否商品品质不好、是否客流下降、是否客单下降……. 会形成各种商业场景问题的原因假设,基于各种假设来利用进行验证分析。
当然如果对业务不熟悉,也可以通过对各种数据相关指标来进行对比,找到可能影响的关键因素。例如:如果客流下降,是否某个价格带的商品太少,或者缺少引流品牌,是否缺少足够多的引流商品。一般是通过把当前的数据与这个区域的历史数据纵向对比分析;与其它区域的横向对比进行分析发现。
2)如果是所有区域都下降,而且下降幅度相差不会太大
可能就是公司整体商品策略、价格策略、促销策略,或者整体的社会环境导致用户的购买力下降。形成相关假设后,一样用数据去验证这个假设。假设销售的下降,是由于某类型顾客流失率在持续上升导致。那业务需要针对这类企业进行针对性营销动作以做挽回。这个时间可能需要“机器学习”这种有“技术含量”来支持:
①构建机器学习模型
这个时候可能构建机器学习的预测模型,为每位顾客的流失概率打上标签,根据流失概率来提前做预测。
小提示:一个顾客如果已经流失了,挽回的可能性一般是很小的,或者要挽回的代价很高。对于用户购买相对高频商品的公司来说,一般都会对流失用户提前预测。
当然,也可以通过数据分析,寻找找到几个关键数据指标来划分,这时候针对是一类型的顾客,而不是一个顾客。也一样可以提升营销的效率。
二种都是解决问题的方法与工具;都是能解决问题,在精细度上有一定区别,但前面一种“成本”也比较高,我们数据分析师也一定要商业最重要一个指标的衡量:ROI。所以根据实际情况和资源来决定用什么方法。

②构建智能营销数据产品
对每个用户有各种根据数据分析生成的标签,例如:价格带偏好、品牌偏好、购物时间偏好、购买金额偏好,高价值标签,活跃度标签等;也会有各种机器学习模型构建的标签,例如:通过不同的场景的聚类,打上相应的标签,像生命周期标签;对用户的流失概率建模,打上流失概率标签等。
利用数据内容,业务可以设置一个规则,系统可以每天定时计算,也可以用户产生新数据后实时计算,从而更新用户的标签或者各种概率值。当用户满足某个值的时候,自动促销哪种类型的营销手段,以哪些触达方式促销用户。
会员或者活动运营的同学可以及时看到各种报表统计数据来看营销效果:数据分析师可以不断的迭代机器学习模型,用新的数据不断持续优化模型,提升预测准确度。
业务同学可以营销效果结合相应的数据分析结果,不断的迭代与优化对应的营销方式。数据分析师,从职业发展来看,随时发展可以走技术路线:机器学习、数据产品方向;或商业分析方向!
小经验总结:
数据分析核心还是要懂业务,懂商业逻辑。用“假设检验”的思维去做数据分析,往往是一个优秀的数据分析师的最重要的“特长”。个人观点:这个特长可能是书上学不来了,他还真的靠自己不断的实践,不断的问为什么形成的。包括我写的文章,只能帮助大家更好的理解,打个认知。同时有一些小经验分享,少转一点点弯路。
把基础数据工作做好往往是深入理解商业逻辑中重要的方式,基础做好的,才能做数据分析这种相对高大上的内容真正做好。
看事实数据,是基础,是核心,也是关键:
我把数据临时需求、数据报表这二个部分的价值更多在于“看事实数据”。这二个内容提供好后,对业务价值是:看数据,通过数据直观、清晰了解业务实际情况,是否有异常,如果有异常,业务异常发生在哪,从而可以快速做出相应的商业动作。
为什么叫“事实数据”还事实包括二个含义:
一个是数据是正确统计。
是指在数据统计过程中,“数据代码的开发与实现”是正确的,没有统计错。例如:销售金额,不会统计成销售数量,因为数据表、数据字段用错,写SQL代码逻辑写错;这种更多是避免“技术”上的错误导致数据不准确。
一个是是指数据指标定义是符合要分析场景,没有被“人为修饰”过。
数据的加工是根据特定场景,按实际需要进行定义的。数据反应真实的业务状况,业务表现。通过一个例子来说明一下:转化率=订单量/UV;还是会员数/UV;
1)应该是用订单量还是会员数,应该用什么状态的数据:创建产生的订单/会员,支付产生的订单/会员,还是支付成功的订单/会员;
2)UV是指访客,访客是按cookie统计,还是按用户的设备号统计。数据指标定义实现没有所谓的“百分之百”的准确,在特定场景下根据数据要反馈或者分析的特定问题,我们应该使用更真实的数据指标。就我们上面的转化率,如果汇报的同学想表达“特定”观点,可以会针对性定义某应的数据指标。而不是根据相对“客观”真实反馈数据的话,可能呈现的数据指标会出现截然不同的二个结论。
有时候会听到说,“数据会撒谎”,数据本不会撒谎,但是就看用的或者加工数据的人怎么处理了;数据是用来反映问题,帮助解决问题,不应该让数据成为掩饰问题的手段。
经验小分享:
一、应该让业务看到真实数据,保证数据一致,各个出口看到的数据指标不打架,至少应该是关键数据指标像KPI不打架。这种关键指标应该是定义好,不允许更改,如果要更改也必须是管理层来确定。
二、在实际很多企业中,能做好数据临时需求、数据报表构建好,已经能解决企业很大的问题,对任何业务团队的来说,可以准确、及时、完整的看到数据,通过数据可以很好的看清楚业务状况,业务结构。
“通过数据,可以很直观反馈业务是否健康,是否有异常,利用数据可以快速的监控、定位业务的健康状况。”“帮助业务团队做决定,最重要搞清楚问题是什么,什么是最为重要的。如果问题都还没有搞清楚,定义清楚,凭感觉就简单的做出各种决策。这是“拍脑袋行为”,在目前竞争环境下,已经不再适应!”
当前面这些基础做好后,才有可能去谈,如何做数据分析。因为做数据分析最大的前提是要清楚定义问题;下篇文章我们再来谈谈数据分析。期待与大家进一步探讨。


雷达卡
京公网安备 11010802022788号







