分析模型中的大数据与小数据之争-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 数据>>

大数据

>>

分析模型中的大数据与小数据之争

分析模型中的大数据与小数据之争

发布:ml8709 | 分类:大数据

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

转自TechTarget中国大数据环境给数据科学家和其他职业分析师提供了大量的数据。但很多情况下,经验丰富的数据分析师和咨询师认为,在大数据分析应用中部署有效分析模型的关键不是“大”,而是“小”。http://img.tec ...
扫码加入数据分析学习群


转自TechTarget中国
大数据环境给数据科学家和其他职业分析师提供了大量的数据。但很多情况下,经验丰富的数据分析师和咨询师认为,在大数据分析应用中部署有效分析模型的关键不是“大”,而是“小”。
http://img.techtarget.com.cn/bi/article/2013/12/16165429_1757.jpg
旅游网站运营商TripAdvisor业务部门的数据分析总监Michael Berry表示,大数据并不会改变预测分析和数据挖掘的分析建模的本质属性。在2013年预测分析全球大会的主题演讲中,Berry认为通过分析样本就可以把隐藏在大数据中的类型和关系发掘出来,不需要去梳理整个的数据。
Berry表示:“我一般不在分析模型中使用太多的数据,因为样本足以揭示规律,而且速度很快。如果你有足够的数据发现了一个模式,那么你添加再多的数据,结果也不会变。对于分析查询,用少量的时间分析少量的数据,效果反而好过用大量的时间分析大量的数据。”
咨询公司Rexer Analytics的总裁Karl Rexer也同意Berry的观点。他认为“样本分析很有效”。试想,一个大公司的分析团队在利用分析模型预测潜在客户流失的时候,它可能拥有成千上万的客户的海量的数据,“但是,真的要把所有的数据都用到吗?很多时候,他们不会。”
小样本,大本事
美国一家代理公司的高级顾问和培训总监Tony Rathburn透露,他为客户搭建预测模型的时候,虽然可用的信息有很多,但他经常只用五千个数据记录。大多数预测分析应用只需要分析样本,就能满足分析人员识别客户行为和其他参数的需要。相反,如果把大量的数据不加以分类就放到分析模型中,会增加“噪声”,影响结果的精确度。
存储技术供应商NetApp从它在客户的产品中自动收集性能检测数据,大约有1PB的数据存储在Hadoop集群中,设备传感器每周都会发送1TB的新数据。Shiv Patil是其中AutoSupport团队的高级数据仓库架构师兼业务分析师,他和他的同事负责使用这些数据,预测设备故障,防止停机和中断带给客户的损失。
Patil表示,AutoSupport分析团队在搭建预测模型时使用的是样本数据集,而不是整个数据集。团队只需要找到他们需要的样本,不需要全部的数据。创建样本会花费精力,需要反复试验,但一旦样本建立,之后就只要添加数据就可以了。
但并不是所有的大数据分析应用都可以通过样本完成。比如增值建模。它是预测分析模型的一种,旨在找到能够受宣传影响的潜在客户,而不是无论如何都会购买该产品的客户,这样市场部门就能更有效地锁定目标。广告代理商Carmichael就为客户斯巴鲁汽车使用了增值建模项目,它应用在线广告购买平台供应商Rocket Fuel开发的自动分析服务分析上百万的汽车经销商交易和其他数据记录。
充足的数据变量
Rocket Fuel的分析模型是通过每天监测到的大约三十万个变量来锁定潜在的斯巴鲁客户的,它从邮政编码和网站浏览活动提取诸如人口数据、性别、种族和当地天气类型等数据。在预测分析大会上,Carmichael Lynch的分析战略师Peter Amstutz介绍了斯巴鲁项目,他在接受采访时说:“我不知道使用数据是否有一个饱和点,或许也有其他的预测的方法。”
Rathburn除了建议使用小数据的方法安排和搭建分析模型外,还建议有一个完整的大数据集。“这类似于一个图书馆,你不需要读完所有的书籍,但在你需要的时候,你能找到要找的书”。
咨询公司Abbott Analytics的总裁Dean Abbott表示,拥有大数据能够扩大分析模型的应用范围。比如,因为数据足够多,所以人口数据可以细分到更小的地理单位。这样,“你就可以搭建更复杂的模型,也就是更精确可靠的模型了”。
更多内容,请加入绿色BI社区,与我们共同学习进步吧!http://www.powerbibbs.com
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-2790935-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
经管之家 人大经济论坛 大学 专业 手机版