楼主: offandon
147820 46

[学习分享] 一个普通数据挖掘工程师的成长经历_数据挖掘 [推广有奖]

41
热爱你的热爱 在职认证  发表于 2017-7-3 11:44:36 |只看作者 |坛友微信交流群
想到企业中去,多看看google与ms工程性的文章,想研究就多看看学术大牛的文章,比如ICML,IJCAI,KDD,NIPS,CVPR等。大部分工作是,将已有的机器学习与数据挖掘算法应用到具体的实践中,根据业务场景与数据特点对算法进行改造或者调整等。

使用道具

42
我心孤独 在职认证  发表于 2017-7-5 17:09:13 |只看作者 |坛友微信交流群
大数据技术的战略意义不在于掌握庞大的数据信息,而是对这些含有意义的数据进行专业化处理,提高对数据的“加工能力”,通过加工实现数据的增值,这样的数据挖掘才是评价数据服务的真正标准。

使用道具

43
彩虹之都 在职认证  发表于 2017-7-7 10:45:42 |只看作者 |坛友微信交流群
在数据挖掘中被研究的业务对象是整个过程的基础,它驱动了整个数据挖掘过程,也是检验最后结果和指引分析人员完成数据挖掘的依据和顾问.图2各步骤是按一定顺序完成的,当然整个过程中还会存在步骤间的反馈.数据挖掘的过程并不是自动的,绝大多数的工作需要人工完成.图3给出了各步骤在整个过程中的工作量之比.可以看到,60%的时间用在数据准备上,这说明了数据挖掘对数据的严格要求,而后挖掘工作仅占总工作量的10%.

使用道具

44
点滴记录life 在职认证  学生认证  发表于 2017-7-13 16:07:16 |只看作者 |坛友微信交流群
银行内的数据挖掘,较为侧重统计建模,数据分析对象主要为截面数据,一般包括客户智能(CI)、运营智能(OI)和风险智能(RI)。开发的模型以离线为主,少量模型,例如反欺诈、申请评分,对实时性的要求比较高。
证券行业的数据挖掘,更加侧重量化分析,分析对象更多的是时间序列数据,旨在从大盘指数、波动特点、历史数据中发现趋势和机会,进行短期的套利操作。量化分析的实时性要求也比较高,可能是离线运算模型,但是在交易系统部署后,实时运算,捕捉交易事件和交易机会。

使用道具

45
离婚律师 在职认证  发表于 2017-7-19 11:30:50 |只看作者 |坛友微信交流群
根据功能和侧重点不同,数据挖掘语言可以分为三种类型:
数据挖掘查询语言:希望以一种像SQL这样的数据库查询语言完成数据挖掘的任务。
数据挖掘建模语言:对数据挖掘模型进行描述和定义的语言,设计一种标准的数据挖掘建模语言,使得数据挖掘系统在模型定义和描述方面有标准可以遵循。
通用数据挖掘语言:通用数据挖掘语言合并了上述两种语言的特点,既具有定义模型的功能,又能作为查询语言与数据挖掘系统通信,进行交互式挖掘。通用数据挖掘语言标准化是目前解决数据挖掘行业出现问题的颇具吸引力的研究方向。

使用道具

46
good1234 学生认证  发表于 2017-7-26 09:45:45 |只看作者 |坛友微信交流群
数据挖掘融合了相当多的内容,试图全面了解所有的细节会花费很长的时间。因此我建议你的第一步是用大概三个月的时间了解数据挖掘的几个常用技术:分类、聚类、预测、关联分析、孤立点分析等等。这种了解是比较粗的,目标是明白这些技术是用来干什么的,典型的算法大致是怎样的,以及在什么情况下应该选用什么样的技术和算法。

使用道具

47
静果果 发表于 2017-8-25 09:08:22 |只看作者 |坛友微信交流群
求楼主公众号名称!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 14:49