楼主: ziyenano
3101 10

[原创博文] 说说BI行业的数据挖掘、分析 [推广有奖]

  • 0关注
  • 52粉丝

院士

7%

还不是VIP/贵宾

-

威望
2
论坛币
6137 个
通用积分
27.3501
学术水平
338 点
热心指数
326 点
信用等级
298 点
经验
57355 点
帖子
880
精华
1
在线时间
4131 小时
注册时间
2012-1-4
最后登录
2024-4-18

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

       干这行也有几个年头了,一直想写点东西跟大家分享讨论(无奈自己太懒╯□╰),恰好前几天回答了一位坛友的问题,索性把东西拿来另开一帖。希望能给想入这行的朋友一点帮助,也希望资深人士来拍砖。
      曾几何时,我认为数据挖掘是比数据分析高端的,可是干这行干到现在,我觉得两个其实是一码事,没有必要分的那么清楚。可能行业内的标准,数据分析侧重于数据库,SQL,报表之类的,数据挖掘更多的倚重统计学、机器学习算法之类的。但是你要是觉得自己多学了点算法,或者精通了“数据挖掘几大经典算法”就别无他求,那我建议倒不如啥也不会,先去行业内敲敲SQL,学习一下分析的思维。分析的思维,你的想法,我认为这才是分析行业最有价值的东西。分析挖掘它首先是业务为导向的,我想每个行业的业务规则也够我们学习一年半载了,在熟悉业务规则的基础上,去分析,去建模等等,这才是真正有意义的,否则单纯玩数学、数字,不做也罢。

      当然,我并不是说算法无用,大牛们搞出的这些东西,都是经过严格的推理证明,解决了很多既定的场景,诸如“分类、聚类、预测等等”。我更愿意把这些东西当成一个工具,可能是稍微NB一点工具,当有些问题确实能够转化成这些模型的时候,这无疑是很好的选择,此时就需要你要了解这些算法,毕竟你要能够解释你做出来的东西,盲目拿个软件瞎点点,确实是件可怕的事情。

      在分析上,我的建议是“怎么简单怎么来”,能用一个均值解释清楚,就别用乱七八糟的东西了,挖坑再填坑的事情还是少干,也要有点业界良心。不过如果领导强逼着挖坑填坑,另当别论。切忌为了模型用模型,可能很多人都会经历这段,因为总会有某个时段会对模型算法什么的痴迷,记着改就好,分析手段无所谓高端不高端,达到想要的目的就好。

       PS:很多人觉得数据挖掘算法有点高端、神奇,其实我从未觉得那些算法神奇,看着推导过程,一步步就下来了,我只是觉得设计算法的人神奇,他是怎么想到的。自然自己写算法也是另外一个境界了,没啥资本多说。

      最后说说大数据分析,区别就是“大”了,其实目前国内除了那几家公司,其他的多多少少都有点扯淡的,搞得起几千台集群,付得起那电费的公司估计不多。存储侧的东西不是太懂,说说分析侧,由于数据量的提升,你不得不考虑机器、算法的内存,效率。一些传统的分析方法也会失效,可能你需要考虑并行,一些底层语言等等来规避内存和时间的问题。总而言之,数据越大,带来的麻烦也越多,需要兼顾的东西也越多。理念就是这样,但说着容易,其实不易。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:BI行业 数据挖掘 机器学习算法 数据挖掘算法 大数据分析 行业

已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
李会超 + 60 + 1 + 1 精彩帖子
webgu + 100 + 100 + 3 + 3 + 3 好久不见,别来无恙!

总评分: 经验 + 160  论坛币 + 100  学术水平 + 4  热心指数 + 4  信用等级 + 3   查看全部评分

沙发
xuyongbin08 发表于 2014-9-3 14:21:16 |只看作者 |坛友微信交流群
赞一个,顶卤煮

使用道具

藤椅
run_psw 发表于 2014-11-6 16:58:19 |只看作者 |坛友微信交流群
前辈,首先再次感谢一下你对我的指点。非常赞同你的一个观点,一定要先懂行业,懂业务需求。这是最重要的基础。
同时希望你能推荐一下数据分析与挖掘方面入门级的书或者资料。祝工作顺利!

使用道具

板凳
ziyenano 发表于 2014-11-6 19:28:20 |只看作者 |坛友微信交流群
run_psw 发表于 2014-11-6 16:58
前辈,首先再次感谢一下你对我的指点。非常赞同你的一个观点,一定要先懂行业,懂业务需求。这是最重要的基 ...
撇开概率统计方面的书,spss clementine数据挖掘宝典  这本书挺不错的,应该是电子工业出版社的。当然我不是说这个软件好,这本书前面的知识讲的比较全面比较细。

使用道具

报纸
Bridgenc 发表于 2014-11-6 20:24:24 |只看作者 |坛友微信交流群
Thanks.....

使用道具

地板
respringwa 发表于 2014-11-11 17:45:24 |只看作者 |坛友微信交流群
还可以

使用道具

7
seacatli 发表于 2014-11-20 17:20:29 |只看作者 |坛友微信交流群
写得好~赞一个~

使用道具

8
soporaeternus 发表于 2014-11-21 11:20:16 |只看作者 |坛友微信交流群
搞挖掘很难,难到就像造登月飞船一样。
但是再难也没有懂业务,懂商业模式难,因为后者是考虑“我们去登月吧”这类问题的层次。

使用道具

9
ziyenano 发表于 2014-11-21 19:29:32 |只看作者 |坛友微信交流群
soporaeternus 发表于 2014-11-21 11:20
搞挖掘很难,难到就像造登月飞船一样。
但是再难也没有懂业务,懂商业模式难,因为后者是考虑“我们去登月 ...
是这么个道理,我觉得建模实质上是对现实场景的数学模拟(可能不是太准确),现实场景的准确理解是模型正确的首要条件。但话说回来,艺多不压身,从严谨的数学去阐述一些东西绝对有其优势,二者兼修是最有意义的。否则,业务人员觉得分析人员不懂业务,分析人员认为业务人员方法太low,以己之长,攻他人之短,相互吐槽,实在没什么意思。

使用道具

10
ayuxi 发表于 2014-11-22 05:37:35 |只看作者 |坛友微信交流群
谢谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 18:15