楼主: mymath
1251 1

[数据挖掘理论与案例] 笔记:pandas数据处理与分析PDF数据集代码习题思考 [推广有奖]

  • 0关注
  • 0粉丝

本科生

22%

还不是VIP/贵宾

-

威望
0
论坛币
100 个
通用积分
0.3637
学术水平
5 点
热心指数
8 点
信用等级
5 点
经验
366 点
帖子
12
精华
0
在线时间
129 小时
注册时间
2021-12-25
最后登录
2023-7-20

楼主
mymath 发表于 2023-7-20 17:18:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
pandas是一个强大的数据处理与分析工具集!梳理了pandas中常用的函数,将函数之间的逻辑关系总结为“基础知识+4类操作+4类数据”的模块结构,展示了数据处理的宏观体系,并针对数据分析中“怎么分析”“怎么处理”“怎么加速”3个核心问题给出解决方案。结合大量代码讲解理论知识,并通过“练一练”和章末的“习题”等形式提供高质量的练习,帮助理解、强化和拓展所学知识。
111.png
以Python中的pandas库为主线,介绍各类数据处理与分析方法。共包含13章,第一部分介绍NumPy和pandas的基本内容;第二部分介绍pandas库中的4类操作,包括索引、分组、变形和连接;第三部分介绍基于pandas库的4类数据,包括缺失数据、文本数据、分类数据和时间序列数据,并介绍这4类数据的处理方法;第四部分介绍数据观测、特征工程和性能优化的相关内容。
222.png
《pandas数据处理与分析》PDF+数据集代码习题
《pandas数据处理与分析》PDF,324页,文字可复制,耿远昊编写,配套数据集、习题答案、源代码。
下载: https://pan.baidu.com/s/130ifUztEa-qGNipgMIqfWw?pwd=mhyb
提取码: mhyb
333.png
第一部分包含Python基础、NumPy基础和pandas基础。其中,Python基础回顾推导式、匿名函数和打包函数的概念与应用;NumPy基础包含常见的数组操作,如构造、变形、切片、广播机制以及常用函数。 pandas基础包含文件的读取和写入、基本数据结构、常用基本函数以及窗口对象。

第二部分介绍索引,分组,变形和连接这4类操作,其中,第3章涵盖单级索引,多级索引和堂用索引方法:第4章介绍分组模式及其对象的基本概令,聚合函数的使用方法,亦换函数和过滤函数的用法,以及跨列分组的相关内容:第5章讨论长宽表的变形和其他变形方法:第6章涉及关系连接的基本概念,常用关系连接函数和其他连接函数等。
555.png
第三部分介绍缺失数据、文本数据、分类数据和时间序列数据这4类数据。其中,第7章涉及缺失数据的四大操作——统计、删除、填充、插值,以及对Nullable类型的详细解读;第8章涵盖str对象、正则表达式基础、文本处理的5类操作——拆分、合并、匹配、替换、提取,以及常用字符串函数;第9章涉及cat对象、有序类别以及区间类别:第10章涵盖时间戳、时间差、日期偏置和时间序列操作的内容。

第四部分包含数据观测、特征工程和性能优化的内容。第11章介绍可视化的基本方法以及数据观测的一般思路。第12章介绍单特征构造、多特征构造和特征选择的常用方法。第13章介绍pandas代码编写的注意事项,基于多进程的加速方法,基于Cython的加速方法以及基于Numba的加速方法。
666.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据处理与分析 pandas panda 数据处理 数据集

沙发
Killua609 发表于 2023-9-18 15:55:53
此帖仅作者可见

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-3-6 17:00