1658 2

[数据挖掘理论与案例] 深入浅出数据分析 [推广有奖]

企业贵宾

巨擘

0%

还不是VIP/贵宾

-

威望
4
论坛币
624047 个
通用积分
147.0356
学术水平
918 点
热心指数
988 点
信用等级
842 点
经验
398692 点
帖子
9795
精华
48
在线时间
17322 小时
注册时间
2014-8-19
最后登录
2022-11-2

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

深入浅出数据分析


最近一段时间一直在看数据分析相关的书籍,也很幸运地遇见了这三本书《你早该这么玩Excel》《谁说菜鸟不会数据分析》《深入浅出数据分析》。三本书的风格和重点各不相同,第一本侧重于巧妙地使用Excel这个工具,第二本侧重于在数据分析理论的基础上进行基本运用,第三本则是从案例的鲜活角度对一些数据分析方法和思路进行运用展示。感觉像是三部曲,让我从工具到理论到运用依次过了一遍,对数据分析有了一个初步的清晰认识。接下来就是要在工作实践中对这些领悟进行练习,不然就无法将知识变现了。

下面是《深入浅出数据分析》的一些具体内容

第一章

我要研究的对象是什么,分析的重点是什么,我要解决什么?

第二步:将主要的大问题分解为无数的小问题,当小问题解决了,大问题自然迎刃而解。

第三步:评估,将得到的数据拆分 对比 得出有用的结论。

第四步:从分析评估中给出决策。

注意:分析与评估是基于正确的信息基础的,如果是从错误的信息中得出的结论,那么又得从头开始分析。

第二章:实验

通过数据的走势异常判断可能得原因,越多的比较越能发现潜藏深处的问题

有时候我们确定了一对因果关系,我们需要将因果关系倒过来推一下比较好

作为分析师需要不断的考虑混杂因素的影响

做实验的时候常常需要有控制组和实验组,但是即使是这样也不免有混杂因素的影响

可比性? 一个大区域中的若干小区域

随机能够将混杂因素均匀的分散至若干个小区域,最终达到化解混杂因素的目的

控制组是原始对照的作用,实验组才是用于观察效果

第三章:最优化问题

当你希望尽量多的获得某种东西,而为了实现这个目的需要改变其他一些量的值,就是一个最优化问题。

一切模型都是错误的,但其中一些是有用的 by george box

我们无法规定全部的假设条件,但是只要确实一个重要的假设条件,分析结果就可能毁掉。第四章 图形让你更精明

要是手头数据庞杂,而且对于如何处理这些数据没有把握,这时只要记住你的分析目标就行了:记住目标,目光停留在和目标有关的数据上,无视其他。

着眼于问题,只要数据的分析能够解决客户的问题,不管是平凡还是精美都没关系。

数据图形化的根本在于正确比较

一个优秀的图形所具备的优点:

-展示了数据

-做了高明的比较

-展示了多个变量

第五章 假设检验

观察数据变量有个好方法  看变量间是正相关还是负相关,将各个变量利用正负相关性绘制一个模型图。

因为现实中的各种原因呈网络关系,并非线性关系。

作为一个分析师,需要在因果的网络中看出门道,需要开阔的视野,

假设检验的核心是证伪无需选出最合理的假设,只需剔除无法证实的假设

第六章 贝叶斯统计

不能忽视条件概率,需要考虑基础概率来计算我们的生活

有时候将概率转换为整数可以有效的避免失误记住一个公式:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B)

       第七章 信念数字化

将可能 大有可能 有机会 肯定等模糊的概率词汇换成精确的百分比。

始终记住 确认问题才是第一位的

stdev()用来计算一组数的标准偏差,表示数据基于平均值的离散程度

当既定的分析已定,出现新的关键信息,需要在基础概率上做操作,用到贝叶斯统计

第八章 启发法

启发法是从直觉走向最优化的桥梁

直觉往往是靠不住的,看到的是片面,但是启发法可以看到多个选项。

以一个点出发向结果延伸,如果不令人信服,结果之前还需要添加点路径?

第九章 数字的形状

R语言的一些基本操作:source(“”)

用于下载一个表save.image 用于保存表直接输入表的名字,

用于打开一个表hist(表名字$自变量,breakes=)breakes用于分组的个数sd(表名字$自变量)

用于计算标准差summary(表名字$自变量)

返回总体的汇总统计值help(函数名)弹出帮助网页

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:深入浅出数据分析 深入浅出 数据分析 谁说菜鸟不会数据分析 你早该这么玩Exce 深入浅出数据分析


https://www.cda.cn/?seo-luntan
高薪就业·数据科学人才·16年教育品牌
沙发
三鱼鱼 发表于 2014-9-18 20:28:33 来自手机 |只看作者 |坛友微信交流群
widen我的世界 发表于 2014-9-18 14:04
深入浅出数据分析
最近一段时间一直在看数据分析相关的书籍,也很幸运地遇见了这三本书《你早该这么玩Exce ...
书呢?

使用道具

藤椅
luojscd 发表于 2014-9-18 22:20:35 |只看作者 |坛友微信交流群
学习学习!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 23:03