大数据商业革命
什么是大数据?
《自然》杂志在2008年9月推出了名为“大数据”的封面专栏,讲述了数据在数学、物理、生物、工程及社会经济等多学科扮演的愈加重要的角色,如今这个词变成了商业世界中的新宠。我们认为,大数据具有规模大、价值高、交叉复用、全息可见四大特征。特别是,最后两个特征体现了大数据不仅仅有“规模更大的数据”量上的进步,还具有不同于以前数据组织和应用形式的质的飞跃。
数十年来,信息产生、组织和流通方式革命性的变化,其中个人用户第一次成为信息产生和流通的主体。你用QQ和MSN聊天,在电子商务网站的浏览和购物,用信用卡支付,发微博……这一切都将转化为数据存储在世界的各个角落。不论是产生的信息量,可以获取的信息量,还是流通交换的信息量,都一直呈指数增长。
数据规模巨大且持续保持高速增长是大数据的第一个特征。
数据规模爆炸性增长的同时,数据产生的附加价值似乎没有与之同步增长。我们认为,这种滞后情况的症结在于缺乏从海量数据中挖掘价值的高效方法和技术人员。
对于真正的大数据,其价值的增长应该正比于规模的增长,甚至快于规模的增长。
前两个特征主要针对单一数据,下面的两个特征强调的是若干数据之间新的组织和应用形式。我们要找到并实现数据之间一加一远大于二的价值,其间最关键的问题要发挥数据的外部性,譬如国家电网智能电表的数据可以用于估计房屋空置率,淘宝销售数据可以用来判断经济走势……以用户为中心,结合用户在不同系统留下的数据,充分利用个性化的数据挖掘技术,是实现通过数据交叉而产生巨大价值的最可行的途径之一。综上,大数据要求数据能充分发挥其外部性并通过与某些相关数据交叉融合产生远大于简单加和的巨大价值。


雷达卡


京公网安备 11010802022788号







