3899 8

[行业动态] 数据分析:大数据及其预测分析——数据是否越多越好 [推广有奖]

企业贵宾

已卖:160份资源

巨擘

0%

还不是VIP/贵宾

-

威望
4
论坛币
624047 个
通用积分
180.4857
学术水平
918 点
热心指数
987 点
信用等级
841 点
经验
399143 点
帖子
9786
精华
48
在线时间
17322 小时
注册时间
2014-8-19
最后登录
2022-11-2

楼主
widen我的世界 学生认证  发表于 2016-3-14 16:07:57 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数据分析:

大数据及其预测分析——数据是否越多越好


Michael Berry对大数据的浮夸之词颇不以为然。身为旅游网站TripAdvisor的分析总监,他认为更多的数据未必带来正面的业务影响,比如大数据和预测分析的例子。


“很多预测分析的应用其实并不需要所有的数据。”Berry在Predictive Analytics World做主题演讲时说到。因此,对于数据科学家来说,重要的不是想着怎样分析所有的数据,而是看通过哪些数据可以得出真正有价值的结果。那么到底该怎么办呢?“对于这个问题,没有直截了当的答案。”Berry说。


(101).jpg


但是,通过每次增加一些数据的方式来测试预测模型的有效性,可以最终确定多少数据是足够的。比如,当Berry想知道旅游代理商对某家酒店或特定客户的标准价位时,采用计算平均值的方法:选取两个取均值,然后是三个…最终在1万个时均值稳定下来。如果取2万个,均值肯定会发生变化,但这已经没有必要了。


“这就是关键所在。如果你有足够的数据,那么单纯数量上的增加就不会对结果造成很大的影响。”Berry说。


如果过多的数据不会带来本质的不同,那么什么才是关键所在呢?“很多方面。”Berry表示。数据的纯净度、样本的合理全面以及专注于数据质量和挖掘的人才等,都会导致结果的不同。


这些都是预测分析中的关键点,比如指出哪些变量可以使模型更健壮,或者结合哪些来源的数据可以发现新的模式。


“比如风寒效应(wind chill factor)。”Berry说。结合了实际的温度和风速,才能切实分析出人体对于外界环境的感受。


(129).jpg



大数据的误区


Berry并非唯一对当前大数据和预测分析境况有微词的人。咨询公司Rexer Analytics的创始人Karl Rexer认为数据科学家们多少都有点迷茫失措。在其2013年对数据挖掘从业者的调查看出,受访者反馈表明数据规模变得越来越大。但是,当被问及有多少数据被用于真正的分析时,答案和2007年的调查结果并无二致。


这并非证明所谓大数据是一场闹剧。“对于传统的预测分析建模或数据挖掘项目来说,总体的样本规模并未出现增长。”Rexer说。


(114).jpg



缩写词汇命名


将分析术语转化为业务端所能理解的语言,是一种巨大的挑战。工资、人力和服务外包提供商Paychex是这样打破藩篱的:根据业务端的建议来进行描述。


“当我们构建模型时,会举行一个命名比赛。”Paychex的建模分析师Tom Kern在本次Predictive Analytics World上表示。Kern的团队会向用户发送电子邮件,其中对模型进行了简短的描述,并且提供一些词汇供其使用。用户根据实际工作,创造缩写词汇,比如SAM表示销售预期模型(sales anticipation model),TIM表示领域识别和映射模型(territory identification and mapping model)。


如果业务端用户的建议最终被采用,其就会收到一个礼物卡。由此,就可以根据诸如销售人员之类的用户的期望,从而思考预测模型该做些甚么。


(109).jpg



汰渍的策略变化


作为全球最大的零售商之一,宝洁公司宣布推出一款新型的低价汰渍洗衣剂,以此来吸引中端客户。该如何评价这个决策呢?


Shel Smith是市场分析公司Twenty-Ten Inc.的创始人,他的看法是:“如果你发布类似的产品,不仅仅是在获取新的客户,其实还在鼓励已有的客户替换现有的高价产品。”


鉴于当前经济形势的影响,这种担忧并非没有道理。但是,Smith对宝洁的策略持有信心。他认为,宝洁的策略是基于预测模型、海量数据和精准营销来达成的,可以在获取新客户的同时不影响现有品牌的销量。


“宝洁肯定有很多我们不知道的过人之处,但是在获取新客户方面并无什么神秘的。”Smith表示。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:预测分析 数据分析 大数据 anticipation Predictive 数据分析 大数据及其预测分析 数据是否越多越好


https://www.cda.cn/?seo-luntan
高薪就业·数据科学人才·16年教育品牌

沙发
全球之行heart 在职认证  发表于 2016-3-14 16:08:25
对于数据科学家来说,重要的不是想着怎样分析所有的数据,而是看通过哪些数据可以得出真正有价值的结果。

藤椅
美国队长2 在职认证  发表于 2016-3-14 16:24:48
通过每次增加一些数据的方式来测试预测模型的有效性,可以最终确定多少数据是足够的。

板凳
彩虹之都 在职认证  发表于 2016-3-14 16:25:47
对于数据科学家来说,重要的不是想着怎样分析所有的数据,而是看通过哪些数据可以得出真正有价值的结果。

报纸
离婚律师 在职认证  发表于 2016-3-29 18:34:34
大数据营销是基于多平台的大量数据,依托大数据技术的基础上,应用于互联网广告行业的营销方式。大数据营销衍生于互联网行业,又作用于互联网行业。依托多平台的大数据采集,以及大数据技术的分析与预测能力,能够使广告更加精准有效,给品牌企业带来更高的投资回报率。

地板
点滴记录life 在职认证  学生认证  发表于 2016-3-29 18:43:26
大数据营销是基于多平台的大量数据,依托大数据技术的基础上,应用于互联网广告行业的营销方式。大数据营销衍生于互联网行业,又作用于互联网行业。依托多平台的大数据采集,以及大数据技术的分析与预测能力,能够使广告更加精准有效,给品牌企业带来更高的投资回报率。

7
我心孤独 在职认证  发表于 2016-3-29 18:56:38
大数据迷思和对线下操作的批评反映的是一种片面技术倾向,过重的技术视角只会抹杀互联网金融在交易主体、交易渠道、用户体验、普惠思维方面的巨大优势与革新价值。当前的互联网金融企业向别人忽悠下大数据未尝不可——只是,千万不要把自己也忽悠进去了。

8
心从未停止呼吸 在职认证  发表于 2016-3-29 19:03:14
不要为了大数据而作大数据,初以为略有道理,现在发现,仍有很多人埋在这个坑里,为了大数据而做大数据,不仅是现在一些创业者和投资者的误区,甚至很有可能在未来的一小股泡沫中,越吹越大,这股泡沫什么时候来谁也不知,或许半年,或许两年。

9
临时同居 在职认证  发表于 2016-3-29 19:17:25
大数据的鼓吹者希望人们相信,在一行行的代码和庞大数据库的背后存在着有关人类行为模式的客观、普遍的洞察,不管是消费者的支出规律、犯罪或恐怖主义行动、健康习惯,还是雇员的生产效率。但是许多大数据的传道者不愿正视其不足。数字无法自己说话,而数据集——不管它们具有什么样的规模——仍然是人类设计的产物。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 21:27