楼主: run_psw
5207 2

[技术讨论与投票] 数据分析软件,和BI系统差别和相似点在哪里 [推广有奖]

  • 3关注
  • 1粉丝

硕士生

88%

还不是VIP/贵宾

-

威望
0
论坛币
306 个
通用积分
0.0604
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
3098 点
帖子
152
精华
0
在线时间
109 小时
注册时间
2014-1-13
最后登录
2017-5-8

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据分析软件,和BI系统差别和相似点在哪里?数据分析和大数据挖掘的区别又在哪里呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析软件 数据分析 分析软件 BI系统 大数据挖掘 软件

要想得到你从未得到过
沙发
ziyenano 发表于 2014-8-15 17:54:11 |只看作者 |坛友微信交流群
数据分析软件通常来说集成了数据处理、可视化、更主要的是集成了很多经典算法,也要确保软件是稳定、高效、准确的。
       BI系统更多侧重于某个行业、或者某个公司的数据分析、图表、报表的展现,算法多数是通用的,而每个行业有每个行业的侧重点,不能一概而论。
       BI系统的数据分析很多时候会基于数据分析软件,毕竟很多算法不是短时间可以开发的,更别说媲美专业分析软件的分析能力。像SAS、SPSS等等这种商用软件,也是一帮精英团队积淀了几十年,才有今天的成就。
       主要说说数据分析与数据挖掘:
       曾几何时,我认为数据挖掘是比数据分析高端的,可是干这行干到现在,我觉得两个其实是一码事,没有必要分的那么清楚。可能行业内的标准,数据分析侧重于数据库,SQL,报表之类的,数据挖掘更多的倚重统计学、机器学习算法之类的。但是你要是觉得自己多学了点算法,或者精通了“数据挖掘几大经典算法”就别无他求,那我建议倒不如啥也不会,先去行业内敲敲SQL,学习一下分析的思维。分析的思维,你的想法,我认为这才是分析行业最有价值的东西。分析挖掘它首先是业务为导向的,我想每个行业的业务规则也够我们学习一年半载了,在熟悉业务规则的基础上,去分析,去建模等等,这才是真正有意义的,否则单纯玩数学、数字,不做也罢。
       当然,我并不是说算法无用,大牛们搞出的这些东西,都是经过严格的推理证明,解决了很多既定的场景,诸如“分类、聚类、预测等等”。我更愿意把这些东西当成一个工具,可能是稍微NB一点工具,当有些问题确实能够转化成这些模型的时候,这无疑是很好的选择,此时就需要你要了解这些算法,毕竟你要能够解释你做出来的东西,盲目拿个软件瞎点点,确实是件可怕的事情。
       在分析上,我的建议是“怎么简单怎么来”,能用一个均值解释清楚,就别用乱七八糟的东西了,挖坑再填坑的事情还是少干,也要有点业界良心。不过如果领导强逼着挖坑填坑,另当别论。切忌为了模型用模型,可能很多人都会经历这段,因为总会有某个时段会对模型算法什么的痴迷,记着改就好,分析手段无所谓高端不高端,达到想要的目的就好。
        PS:很多人觉得数据挖掘算法有点高端、神奇,其实我从未觉得那些算法神奇,看着推导过程,一步步就下来了,我只是觉得设计算法的人神奇,他是怎么想到的。自然自己写算法也是另外一个境界了,没啥资本多说。
       最后说说大数据分析,区别就是“大”了,其实目前国内除了那几家公司,其他的多多少少都有点扯淡的,搞得起几千台集群,付得起那电费的公司估计不多。存储侧的东西不是太懂,说说分析侧,由于数据量的提升,你不得不考虑机器、算法的内存,效率。一些传统的分析方法也会失效,可能你需要考虑并行,一些底层语言等等来规避内存和时间的问题。总而言之,
数据越大,带来的麻烦也越多,需要兼顾的东西也越多。理念就是这样,但说着容易,其实不易。




使用道具

藤椅
run_psw 发表于 2014-8-16 21:42:12 |只看作者 |坛友微信交流群
ziyenano 发表于 2014-8-15 17:54
数据分析软件通常来说集成了数据处理、可视化、更主要的是集成了很多经典算法,也要确保软件是稳定、 ...
感谢您的解答与指导。真诚的希望,能和您教个朋友。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-3 07:02