工作中,从基本的linux到,hadoop,hive的安装、测试和对其自身理论的研究,后来开始研究mahout,学了一大堆模型也在不断夯实自己理论基础,在这么一路上,始终思考一个问题:数据多了,统计理论面临的问题,也看了mckinsey的关于大数据时代等,我以为被大家抄的火热的大数据时代,对我们有几个要求:
1、重视小概率事件,我的一个同事在建立模型中,10%的人(样本100w)认为没有考虑价值,而这个对客户在1亿以上,其实保守估计也在1000w,难道这些也不考虑
2、提升自己的商业思维,在实践中学习和发展,我们做这个东西商业价值到底有多大,我们要客观,而我们不要沉迷于大数据这样的字眼。现实,很多数据缺失,有的数据是在没有目的的收集,一个数据仓库必须要有商业头脑和分析思维的人来架构,否则机器用了上千台,但价值不大。没有商业价值的分析就是浪费时间和金钱。
3、要从事大数据分析,就必须从基础做起,夯实基础(理论基础、商业思维、数据的重视与藐视、好的文笔等)
厚积薄发,可以从不同数据论证相同问题,这是大数据好处,因为提高了精确性。


雷达卡




京公网安备 11010802022788号







