大数据需要统计学作为基础来支撑。大数据与统计学相结合,才能更好地进行数据的分析。近年来,存储设备的单位成本以惊人的速度下降,我们可以轻而易举地积累起大量的数据。电信 运营商,可以记录用户通话、短消息、无线上网产生的每一条信令,省级运营商一小时写入存储设备的数据量可以达到几百G。电子商务网站,可以记录用户的每一 次交易,甚至每一次点击,可以复原用户的完整访问路径找出用户的兴趣点。城市监控体系,在各个重要路口,高速公路上的摄像头,每秒钟都在产生海量的视频数 据。在生命科学领域,对人体的DNA分析,一个个体就能产生几个G数据,可以想象如果一个生物信息数据库里包含了成千万的个体数据,信息量将会是怎样一个 规模,如此等等,不胜枚举。我们毫无疑问,正处于一个信息爆炸的时代。
不幸的是,我们得到的这些数据中的绝大部分,在它的生命周期里基本上都被闲置着,从来没有考虑过产生任何的价值,唯一的用途就是“保存备查”。尽管“啤酒 与尿布”的故事,已经写入教科书有10多年了,几乎每一个接受过专业教育的同仁都知道数据挖掘能产生的价值,但是直到今天,我们对数据的处理依然很低。造 成这种情况的原因有很多。其中之一是,在各公司里保管数据的大多是IT人员,他们通常都缺乏必要的数学素质和知识基础去进行建模和深入的分析工作,即使是 业务人员也鲜有对数据有深入认识者。我们推出大数据系列(包括Hadoop,NoSQL,Mahout等)和数据分析系列(包括R,SAS等)课程后,观 察学员(特别是IT工作者和业务人员)的学习状况,发现他们中的大多数严重缺乏进一步挖掘数据价值所需的数学素养。本门课程的目标,正是要打破这种鸿沟, 为大家巩固基础,为进一步在数据领域前进提供更强动力。统计学,被誉为是数据金字塔的“基础之基础”,统计学知识扎实,无论学习R,SAS,机器学习,数据挖掘,大数据分析等领域知识都会得心应手,省去回头补课的麻烦。
在这样的情形下,人大经济论坛开始进行各种各样有关数据分析的课程培训,并得到了学员的一致好评。


雷达卡






京公网安备 11010802022788号







