请选择 进入手机版 | 继续访问电脑版
楼主: funny每一天
4047 0

大数据时代, 大数据处理的成本控制不容小觑 [推广有奖]

  • 0关注
  • 1粉丝

副教授

38%

还不是VIP/贵宾

-

威望
0
论坛币
1882 个
通用积分
8.3057
学术水平
13 点
热心指数
20 点
信用等级
12 点
经验
8631 点
帖子
1177
精华
0
在线时间
273 小时
注册时间
2014-8-19
最后登录
2018-4-12

funny每一天 学生认证  发表于 2017-11-23 11:18:58 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

大数据时代, 大数据处理的成本控制不容小觑


在大数据时代,最不缺伐的就是峰值流量的出现。一旦出现降价、打折或者平台周年庆,当日的峰值流量将可能刷新平台服务器承载上限,而这也意味着多种压力共同提升,其中最容易被忽视的一部分在于数据。因为当天数据量会爆炸,如果不及时处理,这些数据的核心价值将会随之而降低。

【CDA经管之家】

点击进入21世纪大数据人才汇聚领域』

点击进入21世纪数据分析精英聚集地』

点击进入21世纪大数据高薪就业领地』


76.jpg


流量峰值带来数据爆炸


从去年的数据来看,我国电商业务的交易额达到了22.97万亿元,同比增长25.5%。这种增长率也意味着数据量飙升,从服务器、网络、物流、售后和品控等多个方面的数据都会产生压力。


服务器与网络的数据压力将首当其冲。每次活动前夕,程序员几乎都要彻夜难眠,有时需要靠”玄学”祈祷才能帮助服务器度过难关。即便云服务器准备再充分,扩容再强,也很难保证千军万马同一秒冲入活动界面时不会出问题。


商业促销是各种数据的爆炸点


相应的,商业促销也会带动物流方面的数据的爆炸。去年我国快递企业营收为4005亿元,同比2015年增长44.6%。如此大量的订单不仅存在的交通、工作人员等方面的难题,还有物流信息的处理、同步和管理等大量的难题。


品控和售后是对平台品牌的保障,如果这两步出了问题,那么平台就会面临口碑下滑,甚至活动起到相反的效果。而在活动期间,进行品控和售后都绝非简单,这些数据的产生和消化都在考验着工作人员和官方平台的协调能力。


数据资源面临时间考验


在这些方面产生的大量数据之后,把活动期间产生的大数据简单的统计然后丢弃显然是一种资源浪费。想让这些数据资源实现价值,在存储、处理和分析等方面都存在不小的难题。


第一,活动期间,企业将全面面临人手不足的问题。因此程序员、运维人员和系统管理人员常常顾此失彼,数据处理和分析人员又不能招收临时工应急,反还会被外借到其他部门去做紧急处理,从而让大量的活动峰值数据面临搁置危机。


第二,活动期间是一个数据爆发点,这些数据具有大流量、高并发和急需求等多种特点。原本慢条斯理的数据处理工作面临转瞬即逝的问题,简单来讲这就像把一个月的工作堆积到一天去完成,数据处理难上加难。


第三,数据处理等不得。事实上,所有的大数据都具有等不得的特点,数据的价值保质期仅有三个月,而以一些时效性较强的商业数据迭代速度更快,如果得不到处理,那么消耗大量资源存储的商业数据自身价值就会急速下滑,对企业的指导作用都会相应的下降。

89.jpg


数据处理要成本把控


平台开展促销活动不仅仅是为用户着想,也是对自身负载上限的一次考验。在未来几年中,我国的物流行业将会进入日均1亿快件的节奏,这就意味着订单量会爆发性增加,物流频次加速,数据量继续上升,数据处理的提速和降耗将会变成急需解决的问题。


数据处理提速目前提倡的是流式大数据处理,流式处理的优势在于借助开源的分布式系统,运行数据流代码时,分配数据到容错力高的计算机中并行运行,从而达到低延迟、可扩展和容错率高的目的。但这种处理方式最大的限制在于成本过高,尤其是对于超大量数据应用流式数据处理会让平台得不偿失,以此处理所得的数据价值未必比成本更高。


数据处理降耗则是指降低在数据处理过程中的人力和财力消耗。在促销活动期间,用人紧张导致人力资源价值提升,这就需要在数据价值和人力价值之间寻找平衡点;同时无法处理的数据在存储和管理方面的成本也需要纳入考虑范围。


解决数据问题需要从多个层面来考虑:人力方面,数据价值是不可忽视的一部分,专业人从事专业事,让人的价值最大化发挥;技术层面,将人工智能的深度学习和机器学习技术深化与大数据技术的结合,让人在大数据处理流程中只指挥,不执行,把计算力还给云和HPC;数据层面,强化数据分流,将时效性明显的数据优先处理,并且有选择的进行数据清洗,降低存储和管理成本,提高处理效率。

94.jpg


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据时代 大数据处理 成本控制 大数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-28 19:55