楼主: 浮世若离丶
2144 77

用数据说话,Python和R哪家强?   [推广有奖]

回帖奖励 90 个论坛币 回复本帖可获得 3 个论坛币奖励! 每人限 1 次
  • 4关注
  • 47粉丝

内部工作人员

教授

8%

还不是VIP/贵宾

-

威望
1
论坛币
93437 个
学术水平
35 点
热心指数
60 点
信用等级
18 点
经验
9617 点
帖子
521
精华
0
在线时间
983 小时
注册时间
2015-8-6
最后登录
2018-7-20

浮世若离丶 发表于 2018-7-11 10:49:53 |显示全部楼层
本帖最后由 浮世若离丶 于 2018-7-11 10:57 编辑

Python和R是用于数据科学和机器学习的最广泛使用的开源语言。对于一个初露头角的数据科学家或分析师,最大和最棘手的疑问是:我的语言开始?虽然两种语言都有各自的优点和缺点,但在选择自己的语言时,这取决于个人的目的。这两种语言都能满足各种不同工作的需要。Python是一种通用的语言,因此,Web和应用集成更容易,而R是为了纯粹的统计和分析的目的。
(PHP是世界上最好的语言。。。)

本文不是做所谓的语言争论,这类的文章太多了,而是想用数据说话,告诉你一些有趣的发现。

我们从Kaggle上面找了个数据集,这个数据集是Kaggle上面的调查问卷,总说周知,Kaggle是全球最大数据科学社区。该问卷调查了52个国家16716个对象,其中参与人数最多的国家是 United States,共4197人。

一、先来瞅瞅数据是啥个样子
p1.png


来看看整体吧,一共有多少个国家的兄弟们加入了调查,最多的是哪个国家?最小几岁?最大又是几岁呢?
p2.png

厉害了!0岁就开始,还有干到100岁的,这调查结果我只能信一半好吧!

二、首先,我们看看Python和R的使用人数。
p3.png

3.png

人生苦短。。。我选。。。

三、有多大用,大家咋说的呢?
4.png

5.png

6.png

7.png

看来有这么多高手是通杀啊!

四、高手的薪资会不会更高呢?
8.png

是这样滴!同时使用Python和R的比使用单独工具的工资收入高出1万多美金。

五、不同工种的偏好
9.png

10.png

R在视觉上胜过Python。因此,拥有诸如数据分析师、业务分析师等职位头衔的人在图形和视觉上扮演着非常重要的角色,他们喜欢R而不是Python。同样,几乎90%的统计人员使用R,正如前面所述,Python在机器学习方面更好,因此机器学习工程师、数据科学家和DBA或程序员等其他人更喜欢Python。
六、不同的行业用哪门语言呢?
11.png

12.png

R在政府部门还是很强大的,在剩下的其他行业中,Python的份额大约比R高出15-20%。

七、教育背景以及工作情况
13.png

14.png

大约67%的数据科学家都是全职,而大约11-12%都失业而找工作。在教育方面显然对76 %的数据科学家持有硕士学位,而约23-24%他们有学士学位或博士学位。因此,教育似乎是成为数据科学家的一个重要因素。

八、数据科学家们都用什么
15.png
16.png


可以看出,在数据科学工具中,Python,R和SQL是最常用的。

一些值得关注的结论:
1. 大多数的受访者在年龄20-35岁,这表明数据科学的年轻人是很著名的。
2. 调查对象不仅限于计算机科学专业,还包括统计学、健康科学等专业,数据科学是一门跨学科的领域。
3. 学习Python、R和SQL,因为它们是数据科学家最常用的语言。Python和R将有助于分析和预测建模,而SQL最适合查询数据库。
4. 掌握多种工具的求职者在数据科学领域会更有吸引力,获得更高的薪资。

如果你想学Python而又苦于无入门方法和实操案例,下面的课程或许是你不错的选择。

【CDA数据分析周末集训班-python方向】以CDA数据分析师标准等级大纲要求出发,从数据获取(Python爬虫、Mysql数据库)—统计学理论方法—数据分析与软件应用(Python)—数据挖掘和机器学习(Python)—数据可视化(Matplotlib,Seaborn等)整套数据分析流程技术系统讲解,还将结合量化投资、金融、银行、电信等行业真实需求出发全部用实际案例教学来使所学项目课程更能符合企业要求。

一、课程信息
时间:2018年8月04日~11月10日
地点:北京现场 & 全国直播
授课安排:现场班9900元 远程班7900元

二、这门课程讲什么?
01章 Python编程基础和网络爬虫
01-01数据分析行业概述
01-02Python安装及介绍
01-03Python编程基础知识
01-04Python爬虫基础知识-网络请求、HTML文档、浏览器开发者工具
01-05网络请求及相应-Requests
01-06HTML文档解析 -BeautifulSoup
01-07常见反爬虫机制及应对
01-08通过API获取数据
01-09Python爬虫实战之头像下载
01-10Python爬虫实战之抓取书籍简介

02章 Mysql数据库基础
01-01Mysql数据库知识介绍
01-02Mysql数据库的基本操作
01-03Mysql数据表的基本操作
01-04数据类型和约束条件
01-05数据的CRUD操作之增加、删除、修改数据表
01-06SQL数据库单表查询和联合查询
01-07SQL操作符和函数
01-08SQL综合案例:彩票数据核对练习
01-09SQL综合案例:电商数据查询练习

03章  数据分析之统计学基础

01-01数据分析行业与知识简介
01-02概率论基础知识
01-03描述性统计分析
01-04统计量与抽样分布
01-05参数估计:点估计和区间估计
01-06假设检验方法
01-07方差分析的基本原理和操作

04章  Python进行统计分析和数据清洗
01-01使用Python进行数据整合与数据清洗
01-02使用Python进行数据分组和抽样
01-03使用Python进行描述性统计分析
01-04使用Python进行参数估计和假设检验
01-05使用Python进行单样本和两样本T检验
01-06使用Python进行方差分析和相关分析
01-07转化漏斗与A/B对比测试

05章  Python进行回归分析和降维分析
01-01使用线性回归做客户价值预测
01-02使用逻辑回归做客户流失预警
01-03连续变量关系探索与变量压缩:主成分、因子分析
01-04聚类分析与客户分群
01-05市场分析其他工具:对应分析与多维尺度分析
01-06案例:电信公司消费偏好聚类
01-07案例:汽车品牌客户感知图

06章  Python进行时间序列和综合案例分析
01-01简单时间序列分析法:平滑算法
01-02平稳时间序列(ARMA)模型设定与识别
01-03非平稳时间序列(ARIMA)模型
01-04时间序列建模步骤
01-05案例:使用Python进行信用卡产能指标趋势预测与监控
01-06案例:使用Python进行电信公司离网用户预警

07章 Python数据可视化
01-01绘图思想的基本原理
01-02Python数据可视化包-Matplotlib介绍与图形绘制
01-03Python数据可视化包-Seaborn介绍与图形绘制
01-04Python数据可视化-Pyecharts介绍与图形绘制
01-06分析结果展示与报告展现

08章 期中项目作业与答辩
01-01课题1:电商客户价值预测
01-02课题2:网站流量数据分析
01-03课题3:信用卡客户流失预警
01-04课题4:银行电话营销响应分析
01-05以上课题仅供参考

09章 Python数据挖掘基础及数据前处理技术
01-01Python数据挖掘简介
01-02数据挖掘方法论CRISP-DM介绍
01-03数据挖掘技术概述
01-04数据前处理方法
01-05关键变量发掘技术

10章 Python进行预测型数据挖掘
01-01朴素贝叶斯与最近领域
01-02决策树算法
01-03神经网络
01-04支持向量机
01-05集成学习:Bagging,Boosting,Random Forest
01-06特征工程

11章Python进行描述性数据挖掘与进阶
01-01聚类分析
01-02关联规则
01-03序列模式
01-04深度学习
01-05文本挖掘

三、如何报名?
1. 在线填写报名信息  
(北京&远程)
2. 给予反馈,确认报名信息
3. 网上缴费
4. 开课前一周发送电子版课件和教室路线图

四、课程讲师
李武卿
美库尔主管高级分析师
具备多年Python,R, SAS语言数据挖掘与机器学习经验。负责过戴尔(美国地区)潜在客户挖掘项目; 美国某银行信用卡违约预测项目;宜家(中国地区)潜在有价值的商品购买组合发掘;也长年负责美库尔公司内部PYTHON数据挖掘员工培训。

赵仁乾
CDA数据分析研究院讲师/北京邮电大学管理科学与工程硕士
现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。

覃秉丰
CDA数据分析师讲师/创业公司技术负责人
机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利。同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。

联系我们
课程顾问:赵老师
13121318867(微信)
17.png


阅读原文链接:http://www.cda.cn/kecheng/29.html




15.png
已有 1 人评分经验 收起 理由
np84 + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

stata SPSS
浮世若离丶 发表于 2018-7-11 10:58:22 |显示全部楼层
学习Python、R和SQL,因为它们是数据科学家最常用的语言。Python和R将有助于分析和预测建模,而SQL最适合查询数据库。
回复

使用道具 举报

Still.. 发表于 2018-7-11 11:01:53 |显示全部楼层

回帖奖励 +3 个论坛币

很不错的课程体系,人生苦短,我用python!
回复

使用道具 举报

ZQZ520 在职认证  发表于 2018-7-11 11:07:10 |显示全部楼层

回帖奖励 +3 个论坛币

python入门简单点,学会python技术总会有好处。
回复

使用道具 举报

xjg 发表于 2018-7-11 16:14:59 |显示全部楼层

回帖奖励 +3 个论坛币

回复

使用道具 举报

songdg 发表于 2018-7-11 16:25:57 |显示全部楼层

回帖奖励 +3 个论坛币

Python和R是用于数据科学和机器学习的最广泛使用的开源语言。
回复

使用道具 举报

十一点的猪 发表于 2018-7-11 16:38:32 |显示全部楼层

回帖奖励 +3 个论坛币

人生苦短   我用Python
回复

使用道具 举报

Edwardu 发表于 2018-7-11 16:40:53 |显示全部楼层

回帖奖励 +3 个论坛币

Python是一种通用的语言,因此,Web和应用集成更容易,而R是为了纯粹的统计和分析的目的
回复

使用道具 举报

atest1 发表于 2018-7-11 16:43:41 |显示全部楼层

回帖奖励 +3 个论坛币

还是python简单些
回复

使用道具 举报

2758845822 发表于 2018-7-11 16:45:48 |显示全部楼层

回帖奖励 +3 个论坛币

感谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-7-20 18:20