楼主: Lay.Terry
955 3

[其他] 大数据人才都去哪儿了? [推广有奖]

学术权威

21%

还不是VIP/贵宾

-

威望
4
论坛币
214340 个
通用积分
1011.9746
学术水平
427 点
热心指数
197 点
信用等级
399 点
经验
69723 点
帖子
769
精华
50
在线时间
2606 小时
注册时间
2011-8-29
最后登录
2024-2-19

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

大数据时代已经来了,许多企业希望将大数据用起来,带动企业的经营,但不知从哪里着手。它们找不到大数据与业务结合的突破口。而一些真正将大数据应用于实战的企业,却在应用过程中困难重重:大数据无法与业务结合;没有收集、分析海量数据的能力;经营人员缺少应用大数据的动力;数据来源鱼龙混杂难以使用。

企业需要结合自身特点,逐步推进大数据应用。对于没有平台部署能力又没有数据收集能力的中小企业,可以利用ZF、社交网络平台等第三方提供的数据进行全量数据分析,从而可以在短时间内对很多业务模型进行全量计算,降低对海量数据和复杂模型的依赖,通过实践反馈来验证和选拔有效的模型。业界已经证明大量数据加简单模型,要比部分数据加复杂模型要来得有效。

对于有数据收集能力的企业,可以充分利用互联网资源,在用户使用产品、服务过程中收集用户行为数据。门户站点、交流记录、客服数据都有可能成为获取用户数据的来源,企业可以通过线上洞察,进行O2O营销的链接和资源整合,从而改善线下用户体验。多源性数据是判断企业是否应用大数据的一个显著特征。

对于已经具备大数据部署能力的企业,未来可以通过Hadoop平台的搭建和部署,通过数据仓库集中、整合、分析数据和信息,利用海量的结构化、半结构化和非结构化数据,提升企业信息化能力,挖掘大数据价值。

未来,大数据的应用会超越营销范畴,全面进入了企业供应链、生产、物流、库存、网站和店内运营等各个环节,Hadoop会从实验走向生产,大数据人才将成为稀缺人才。

2013年的大数据和分析人事调查显示,大多数企业计划采取一个再培训、招聘和外包的组合方案,以填补人才缺口。

惠普宣布了围绕它的MPP-based HP Vertica Analytics Platform的课程模块和认证考试。其入门课程,将在世界各地的HP ExpertOne教室被教授,为期将超过三天。

MAPR和它的竞争对手Cloudera公司和Hortonworks,提供了大量的培训课程。在MAPR的这里,他们通常提供两到三日的MAPR学习视频,其在线和课堂课程主题包括群集管理的基础、Hive和Pig动手操作、MapReduce培训以及HBase编程。

这些培训方案的前提假设是,培训人员属于能干的系统管理员和开发人员,可以迅速学习新技术。

还有一个选择是在线教育,如国内的人大经济论坛、51CTO、PPV课都提供了大数据网络课程。在线教育的优势在于不受时间和地域限制,强调用户自主学习,尽管在完课率和培训效果上仍然存在一些问题,但作为一种内容丰富,可以个性化教学,边际成本更低的培训方式,在线教育未来将有更广阔的发展空间。

在你发出“大数据人才都去哪儿了”困惑后,确定好你的需求和培训的规模,然后找一家合适的培训机构,或许你的问题就解决了。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据人才 大数据 去哪儿 MapReduce Analytics 去哪儿 人才

沙发
liyoujim 发表于 2014-12-12 08:51:10 |只看作者 |坛友微信交流群
去美国就没再回来,其实中国不光大数据人才,其他领域人才也严重匮乏,多的都是优秀快递员和他们的同行

使用道具

藤椅
littledog.. 发表于 2014-12-12 10:16:19 |只看作者 |坛友微信交流群
支持一下

使用道具

板凳
zanshenshi 发表于 2014-12-24 11:04:38 |只看作者 |坛友微信交流群
学好python。
现在几乎所以公司的数据都可以api给你,而python的数据处理能力强大且方便。加之在machine learning的很多算法上,python也独俏一方。另外,它的简明方便迅速迭代开发,15分钟写完个算法就可以看效果了。

除此之外,py还有点酷酷的感觉。任何程序拿matlab和c++都是可以写的,不过我真没认识过哪个d愿意自己把自己扔那个不酷的框框里:D

对不规则输入的处理也给python一个巨大的优势。通常来说,在我现在日常的工作里,所有的数据都是以纯文本但是非格式的形式存储的(raw text, unstructured data)。问题在于,这些文本不可以直接当作各种算法的输入,你需要
分词,分句
提取特征
整理缺失数据
除掉异类(outlier)
在这些时候,python可谓是神器。这里做的1-4都可以直接在scikit-learn里面找到对应的工具,而且,即使是要自己写一个定制的算法处理某些特殊需求,也就是一百行代码的事情。

简而言之,对于数据科学面临的挑战,python可以让你短平快地解决手中的问题,而不是担心太多实现细节

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-16 22:59