楼主: 浮世若离丶
34693 123

[CDA直播]使用Pandas进行数据清洗案例实战   [推广有奖]

回帖奖励 20 个论坛币 回复本帖可获得 5 个论坛币奖励! 每人限 1 次
  • 4关注
  • 69粉丝

已卖:1350份资源

教授

69%

还不是VIP/贵宾

-

威望
1
论坛币
25044 个
通用积分
98.3171
学术水平
71 点
热心指数
100 点
信用等级
50 点
经验
20645 点
帖子
740
精华
1
在线时间
1301 小时
注册时间
2015-8-6
最后登录
2023-7-5

楼主
浮世若离丶 发表于 2019-5-23 15:09:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
“数据科学家们80%的精力消耗在查找、数据清理、数据组织上,只剩于20%时间用于数据分析等。”——IBM数据分析     

现实使用的数据常常是含有噪声的、遗漏的和不一致的。无论是进行统计分析、机器学习还是深度学习,都要求数据真实可靠,数据格式统一。

所以,数据清洗到底是在清洗些什么?

通常来说,你所获取到的原始数据不能直接用来分析,因为它们会有各种各样的问题,如包含无效信息,列名不规范、格式不一致,存在重复值,缺失值,异常值等.....

本次直播给大家介绍如何用Python中自带的Pandas和NumPy库进行数据清洗。在正式介绍直播内容之前,先简单介绍一下这两个非常好用的库。

Pandas的名称来自于Panel data和Python数据分析data analysis,是Python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,被作为金融数据分析工具,为时间序列分析提供了很好的支持,并于2009年底开源出来。

NumPy是Numeric Python的缩写,是Python的一种开源的数值计算扩展,可用来存储和处理大型矩阵matrix,比Python自身的嵌套列表结构要高效的多,提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库,专为进行严格的数字处理而产生。

=== 直播公开课 ===
一、直播主题
使用Pandas进行数据清洗案例实战

二、直播时间
5月24日 周五 20:00~21:00

三、直播提纲
1. 为什么要做数据清洗?
2. 什么是干净的数据:完整、一致、真实可靠、正确、唯一
3. 数据清洗的一般过程:观测分析-模式匹配-清洗处理
4. 案例一则:产品供应时间分析案例

四、参与直播
1. 在线报名预约
http://www.peixun.net/view/1391.html

2. 扫码添加好友回复“Python”加入直播群:
WechatIMG3.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
浮世若离丶 发表于 2019-5-23 15:10:26
掌握数据清洗利器Pandas,让你的数据分析工作游刃有余!

藤椅
heiyaodai 发表于 2019-5-23 23:40:07

回帖奖励 +5 个论坛币

谢谢分享

板凳
比特小生 在职认证  发表于 2019-5-24 10:05:46

回帖奖励 +5 个论坛币

谢谢分享,已经报名学习!

报纸
Still.. 企业认证  发表于 2019-5-24 10:09:11

回帖奖励 +5 个论坛币

使用Pandas进行数据清洗案例实战!

地板
壹手曹刀 发表于 2019-5-24 10:14:05

回帖奖励 +5 个论坛币

数据科学家们80%的精力消耗在查找、数据清理、数据组织上,只剩于20%时间用于数据分析等

7
junzhitianxia 发表于 2019-5-24 10:27:07

回帖奖励 +5 个论坛币

支持一下。这个课非常好希望对学习其它软件的我也有启发

8
chengganglee 发表于 2019-5-24 10:29:52

回帖奖励 +5 个论坛币

支持一下了

9
wh2016 发表于 2019-5-24 10:47:41

回帖奖励 +5 个论坛币

谢谢分享

10
karst 发表于 2019-5-24 11:02:49

回帖奖励 +5 个论坛币

感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-28 17:24