楼主: 胖胖小龟宝
1921 7

关于统计学习和数据挖掘的一些常见问题 [推广有奖]

已卖:46份资源

大师

21%

还不是VIP/贵宾

-

TA的文库  其他...

龟宝的档案室

威望
3
论坛币
793115 个
通用积分
22228.9852
学术水平
2211 点
热心指数
2133 点
信用等级
1424 点
经验
987208 点
帖子
9996
精华
25
在线时间
4757 小时
注册时间
2012-7-27
最后登录
2020-12-21

楼主
胖胖小龟宝 发表于 2014-11-9 17:06:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1. 学习统计有没有用?
肯定是有用的。决策需要数据支撑,而统计学是数据分析的方法论。另一很有用的学科是运筹学,主要做优化方面的东西,但是就LZ经验来看,运用的广度和企业的接受度不急统计学(LZ公司统计背景vs运筹背景大概是10:1的比例)。

2.学什么软件好?
SPSS是上手最快的;SAS是最强大的;R是最灵活且最有潜力的;MATLAB运用的企业很少(有几个特定的行业比如投行之类的很喜欢它)。
如果你是统计背景的学生,那这几个软件应该都会,就不多说了。
如果是非非统计背景,且这几个都没接触过,那我建议你用SPSS,这样可以把精力专注于统计算法的学习上,而非软件本身的使用。而且就国内的情况而言,用SAS的公司主要集中于银行与药厂(如果说错了欢迎SAS公司的朋友指正),这样的企业非统计背景也很难挤进去。

3.报学习班有没有用?
大部分的学习班都是3,4天这样的,课程大纲大概是LZ上学时候1-2年学的东西。想在3-4天学会1-2年的东西,困难可想而知。所以想通过一个学习班学会统计是不可能的。踏踏实实选本书学是正道。LZ很喜欢的一本书:
Discovering Statistics using IBM SPSS Statisticshttp://www.ebookee.net/Discoveri ... istics_2546111.html, 这本书学完基本上统计就算入门了,非常适合自学的一本书(百度上可以找到全彩pdf这种事情我当然不会乱说了)。英文不好的同学不好意思啦,中文的统计书(基于SPSS的)LZ敢说2013年以前出版的全部看过,觉得没有适合自学的。
(LZ的公司每年也会举办很多次SPSS培训,虽然象征性地收几百块钱,但LZ觉得对学生而言也算一笔负担了。学生时间比较多,强烈建议自学,不会的问题到这里或者人大经济论坛问,基本上问的靠谱的问题LZ都会帮助解答的。)
(补充:什么叫做靠谱的问题?比如你要盖一个房子,”房子要怎么盖啊“就是不个靠谱的问题;”非承重墙的砖头要用空心的还是实心的“算是个靠谱的问题。)

4.数学背景弱的人能自学统计吗?
没问题的,LZ很多同事(包括LZ本人)都是本科商科/工科然后硕士转统计的。对于不懂微积分、矩阵运算的同学,可能有些算法理解起来有困难,但是LZ觉得基本不碍大事。进行一个分析有四个很重要的环节:算法的使用前提条件(即assumption),算法的运算逻辑是什么样子的,如何在软件中操作,如何解读软件的输出结果。除了第二点以外,高中数学背景完全可以满足。
弄懂一三四就可以胜任大部分企业的分析工作了,很多业内人士都没弄清楚。(亲身经历,国内某一线市场调研公司的研究员打来电话问算法的时候顺便提了下她正在进行的一个产品测试(A/B test)的问题,LZ告诉她按照她的数据要用配对t检验,她惊呼她们过去10年中一直对这种数据在用独立样本t检验。这就是典型的没弄清楚算法的使用前提条件。)

5.做数据挖掘需要精通统计算法吗?
数据挖掘主要的应用是预测(分类目标、连续目标)、聚类(客户细分)、关联规则。LZ个人觉得略懂统计就可以了。因为各个模型都有评估指标,建模完了直接看模型的效果就可以,当然熟悉算法的话可以帮你去优化模型(但是就是锦上添花的东西了)。
LZ个人觉得做数据挖掘比做统计分析容易,因为你不需要非常懂算法。

6.做数据挖掘需要懂编程吗?
看企业和应用。
比如互联网企业,做自然语言相关的,不懂编程就没法做。很多电商,做数据挖掘,要跟现有的系统做对接,也需要编程。
以上这两种企业特别适合计算机背景的同学。
但是也有很多企业(尤其是企业中做客户关系管理或者营销的部门),需要数据分析和数据挖掘来支持企业决策,主定期分析数据然后写报告。这种企业是各位看见编程就头大的同学最理想的选择。


来自:豆瓣统计学习小组

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:常见问题 统计学习 数据挖掘 统计学 Discovering 统计 数据挖掘 问题 豆瓣

已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
宁静的城np + 100 + 3 + 3 精彩帖子
statax + 20 + 2 + 2 + 1 精彩帖子

总评分: 经验 + 100  论坛币 + 20  学术水平 + 5  热心指数 + 5  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
nonewman 发表于 2014-11-9 18:11:53
分析结论的可用性最重要,即便EXCEL用好了,也不次于大型软件。

藤椅
生生不息2 发表于 2014-11-9 21:56:24
http://www.amazon.com/Discoverin ... atistics+using+spss,这个网址打不开啊,到底是啥书?

板凳
Anita99 发表于 2014-11-9 22:12:33
xuedaole

报纸
youthpasses 发表于 2014-11-10 00:13:50 来自手机
谢谢楼主!

地板
杜松 发表于 2014-11-10 01:14:45
http://www.amazon.cn/%E5%9B%BE%E4%B9%A6/dp/1446249182 好贵 还全英文的...

7
胖胖小龟宝 发表于 2014-11-10 09:25:27
生生不息2 发表于 2014-11-9 21:56
http://www.amazon.com/Discovering-Statistics-using-IBM-SPSS/dp/1446249182/ref=sr_1_1?ie=UTF8&qid=137 ...
已经修改了地址啦~~

8
neversarah 发表于 2014-11-10 09:36:23
还有hadoop MapReduce hive pig python spark 要跟上时代的节奏
这篇文章略老

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 10:59