如今,业界和学术界一直在讨论一个词,那就是大数据。不管是学术圈还是IT圈,只要能谈论点儿大数据就显得很高大上。然而,大数据挖掘、大数据分析、大数据营销等等事情仅仅只是个开始,对大多数公司来说,大数据仍有很强的神秘色彩。于是,在我们还没有完全搞明白如何运用大数据进行挖掘时,各种过于神化大数据的舆论就已经不绝于耳了。当然,也有很多人直接批判大数据或大数据营销给我们造成的隐私威胁。也有很多人根本没有搞清楚什么是大数据,到底有什么价值。
于是,站在客观的角度,围绕下面几个问题与大家分享有关大数据的几个观点,也扒扒大数据的那些事儿:
1、大数据营销和个人隐私泄露究竟有无因果和逻辑关系?2、大数据营销到底能带给企业什么样的价值?到底能带给用户什么价值?用户是否全盘否定或反感大数据营销?3、如何正确看待大数据?如何看待大数据和传统调查方法或统计学的关系?4、大数据营销究竟面临什么样的挑战?
一、大数据的迅猛发展与数据隐私的忧虑相伴而生
社交媒体的出现,让用户数据的分享数量达到了难以估量的程度。而如今,社交媒体的种类有增无减,智能手机的更大普及,又让更多用户转移到移动互联网,从而又进一步贡献更多数据和内容。这样的数据增量让全球社交媒体的收入大涨,仅根据咨询公司Gartner2012年的研究结果显示,2012年全球社交媒体收入估计达到169亿美元。
一边是社交媒体因为大数据的盆钵满载,另一方面则是用户不断毫无保留的将个人信息交给互联网,这些信息包括年龄、性别、地域、生活状态、态度、行踪、兴趣爱好、消费行为、健康状况甚至是性取向等。一时间,针对海量用户信息的大数据挖掘、大数据分析、大数据精准营销、广告精准投放等等迅速被各大公司提上日程。
比如,一个发生在美国的真实故事就会告诉我们,利用数据挖掘如何掌握我们的行踪。一个美国家庭收到了一家商场投送的关于孕妇用品的促销劵,促销劵很明显是给给家中那位16岁女孩的。女孩的父亲很生气,并找商场讨说法。但几天后,这位父亲发现,16岁的女儿真怀孕了。而商场之所以未卜先知,正是通过若干商品的大量消费数据来预估顾客的怀孕情况。
类似的大数据挖掘和营销事件在今天更多的发生,尤其是社交媒体产生大量数据后。于是,许多人对个人隐私数据开始担忧,开始批判大数据精准营销侵犯了个人隐私,忧虑我们进入了大数据失控的时代,并将原因更多归结于社交媒体。
二、大数据营销和个人隐私泄露之间不能完全划等号!逻辑关系不成立!
如果客观的分析一下上述问题就会发现,这是一个难以分说的鸡生蛋还是蛋生鸡的问题。一味地批判大数据分析对个人用户数据的泄露或滥用是不客观的。
因为,社交媒体的本质在于分享和传播,社交媒体的出现的确满足了人们分享个人信息、晒各种数据的欲望,让人们在过去无声无息的生活中突然转移到了可以让全世界看到自己的平台上来。人们从而达到了内心的满足感和存在感。因此,单从个体的背后心理来考虑,社交媒体对他们来说是有益的,他们不认为自己贡献的是不可告人的秘密,既然分享出来,那一定是希望或允许别人看到的。因此,这是一种无形的默许的交易,用户乐意把自己的各种琐碎细节暴露于社交媒体,而对社交媒体上杂乱无章的海量用户数据进行有序的分类和分析也没有什么不妥。
所以,从这个角度来看,大数据精准营销与个人主动分享和传播到网络上的信息数据之间并没有矛盾。人们起初或许会惊讶:为什么他们知道我想买什么?为什么他们知道我的需求?但随着“猜透心思”的推送行为让人们的生活越来越便利时,比如省去大量搜索、查找和对比产品或服务的时间,他们可能会十分习惯并依赖这种精准性,并不会在意他们本来就随意分享到网络上的杂乱信息被如何挖掘和利用。
三、大数据营销究竟会给企业和用户带来什么价值?
讨论完上面的问题之后,我们是否应该诚恳对待大数据精准营销这件事?那么大数据营销究竟对于企业和用户两方面来说,都有什么样的价值?
让我们先看一个国外案例:
我们都知道美剧《纸牌屋》,提到《纸牌屋》的成功,最大的功劳便是大数据分析。因此,《纸牌屋》几乎成了大数据营销的经典案例,也是美国Netflix公司基于用户信息挖掘来决定内容生产的成功尝试。
Netflix的订阅用户达到了3000万左右,而大多数用户的观影都与精准推荐系统有关。Netflix会定时收集并分析用户观看电影或电视剧的行为,比如根据用户对电影的评分、用户的分享行为、用户的观影记录等信息去分析用户的收看习惯,从而推断用户喜欢什么样的影视剧,喜欢什么样的风格,喜欢什么样的导演和演员。在此基础上利用算法对用户感兴趣的视频进行推荐排序,直到用户找到最喜欢的影视剧。《纸牌屋》的导演和主演就是Netflix挖掘用户信息后的预测出来的。
四、不要过分迷信大数据;大数据的实质究竟是什么?
看了上面的分析,或许你会认为大数据分析真是无所不能。但是,我们不能过分迷信大数据,于是接下来的问题就产生了。
1、大数据分析和传统统计学方法有什么样的关系?
大数据所遵从的是:以大量数据,甚至所有数据为基础,然后用算法去计算分析,从而更精准的找到各个因素之间的相关关系(不是因果关系),以发现数据之间的规律。 那我们看看传统的统计学方法,统计分析学解决的就是如何通过选取少量的样本,通过对样本的分析,然后推断整体的趋
势和规律。所以,用的是概率。一般会规定在90%、95%或98%的置信度(精确度)下最大程度推断总体。如果目的明确,样本选取得当,操作科学,那么不需要大量数据就能分析出规律,从而推断出总体的规律,并且可以发现不同因素之间的因果关系。比如,抽样方法确定后,就可以确定样本数量,如果抽样得当,那么样本的数量跟总体的数量之间没有太多直接关系。
举个不恰当的例子以供理解:假设选取1000个样本,推断的规律是A,选取2000个样本,同样呈现出A规律,选取3000也差不多这样。那么,我们实际上科学选取1000多个样本就可以达到目的了。所以,传统的抽样和统计方法,在最大程度上解决了成本问题,虽然会有误差,但仍可以发现的显在规律。
2、什么样的事情是大数据做不到的,而传统的调查分析方法却可以做到?
大数据营销的前提是大数据分析,而大数据分析是基于算法的,是计算机固化的模式。也就是说,原来由人对数据分析的那部分工作,现在我们把它约定到算法里了。并且,大数据精准营销是对用户产生的网络浏览数据、分享数据、搜索数据等等行为信息进行分析,从而对人群或事物进行分类,并由此推测人的偏好、兴趣等。
但是,偏好不等于真实需求,点击不代表一定喜欢。一个人今天在社交媒体上说:“这个产品不错”,就认为他一定喜欢或一定需要这个产品吗?
机器可以对行为分类,但却不能真正探测到人的心理和真实需求。那么,对于人的真实心理和需求的探测,我们如何做到?这时候,传统的市场调查和分析方法是不可取代的。比如,深度访谈法,比如焦点小组访谈法,投射法等等。这些方法都可以在最大程度上,从心理学的角度去分析和发现,人真正的欲望和本质需求。所以,今天很多大的广告公司、营销公司,他们仍然采用这样传统的方法去了解表面数据背后的故事和原因。而这些故事和原因,是算法目前没办法做到的,必须由人来完成。人和人的交流才能探测人的内心。
从这个角度来说,大数据并不是万能的,也不能被一味神话,我们必须清晰的认识到它的实质,它能用来干什么,不能用来干什么。我们可以这样理解:人对数据的计算和分析工作如今可能会被机器替代,但是,人的另一部分工作(探测人内心的能力)没办法被算法替代。
比如,前两年我曾报道过《写书都可以用算法实现自动化了,拿什么挽救出版》这样的新技术,据称目前亚马逊上大量图书都是被算法写出来的,算法会根据人写书的逻辑思路来组织语言。但是,这些书却不能弥补人类情感的缺失,不能表达出社会背景和作者所处环境带来的情感波动等等。